第 1 章 


形式 语言 与 自动 机 


由 于 本 书 的 大 多 数 章节 都 以 形式 语言 各 自动 机 为 主要 工具 ， 
现 将 书 中 所 和 需要 用 到 的 有 关内 容 独 立 册 来 写成 本 章 ， 作 为 预备 知 
识 . 对 于 已 经 了 解 形式 语言 的 读者 , 当然 无 需 阅读 这 里 的 介绍 ; 对 
于 不 熟悉 形式 语言 的 读者 , 也 建议 只 需 对 本 章 稍 作 浏 览 , 在 需要 时 
再 查阅 本 章 的 有 关 段 节 , 或 参考 有 关 文 献 ， 

本 章 并 不 是 关于 形式 语言 和 自动 机 的 全 面 论述 ， 内 容 选 取 完 
人 多 由 本 书 其 余 章 节 的 需要 决定 .所 有 理论 性 的 证 明 也 全 部 赂 去 ， 
需要 了 解 这 方面 知识 的 读者 , 可 参看 [1]. 

最 后 , 关于 形式 语言 说 几 句 ， “形式 语言 ”这 个 词 看 上 去 似乎 
很 抽象 , 实际 上 很 简单 , 只 不 过 是 符号 串 的 集合 。 凡 是 与 符号 串 有 
关 的 研究 领域 ， 都 有 可 能 从 形式 语言 理论 中 已 经 发 展 起 来 的 概念 
利 方法 得 到 启发 或 帮助 ， 本 书 的 主要 内 容 可 以 看 成 是 形式 语言 在 
动力 系统 研究 中 的 应 用 ， 当 然 这 仅仅 是 开始 ， 


$1 有 限 自动 机 与 正规 语言 


$1.1 有 限 自 动机 的 构造 


可 以 将 有 限 自 动机 设想 成 如 图 -1(i) 所 表示 的 一 全 机 妖 ， 它 

由 一 条 划分 为 许多 方 格 的 输入 带 和 在 图 中 用 一 个 方 框 表 示 的 控制 

器 (或 控制 装置 ) 组 成 。 控制 器 具有 有 限 个 可 能 状态 ， 并 在 每 个 时 

刻 仅 处 于 其 中 的 一 个 状态 . 在 这 里 ， 认 为 时 间 是 离散 的 ， 饮 如 用 

t=O 代表 初始 了 时刻 , 用 +=1 代表 下 一 时 刻 ， 等 等 ， 习 惯 上 将 控制 

器 的 初始 状态 记 为 go. 控制 器 有 一 个 读 入 头 ， 即 输入 部 件 ， 几 于 
l 


(i) 


1-1 


从 输入 带 读 入 信息 ， 在 输入 带 的 每 一 个 小 方 格 中 可 以 容纳 ~ 个 符 
F. 这些 符 号 均 取 自 一 个 只 由 有 限 个 符号 组 成 的 符号 集 S. Sd 
称心 为 输入 符号 集 。 我 们 还 假定 输入 带 左 方 有 限 ,在 t=0 时 读 入 
头 的 位 置 就 在 左 端的 第 一 个 方 格 上 .以 下 将 控制 器 的 状态 集合 记 
AQ. ME WE, 

控制 器 的 功能 是 根据 当前 时 刻 所 处 的 状态 2 和 读 入 头 从 输入 
带 上 得 到 的 符号 a, 确定 控制 器 在 下 一 时 刻 的 状态 g, 实现 这 个 状 
态 的 转移 , 同时 将 输入 头 向 右 移 动 一 个 方 格 宽度 的 距离 , 为 扫描 符 
Fa 右面 的 下 一 个 方 格 作 好 准备 .这 就 是 图 1-1QD + Pp 的 情 
说. 这 里 不 排除 gg 的 可 能 性 .我 们 也 可 以 拒 “ 读 入 头 向 右 移动 ” 
的 说 法 改换 成 “输入 带 向 左 移动 ”的 等 价 表 述 . 

这 里 假定 对 每 个 状态 2EQ ABA EET AS OCS, H 
器 总 是 作出 完全 确定 的 反应 .我 们 称 这 样 的 有 限 自 动机 为 确定 性 
有 限 自动 机 . 

控制 器 还 具有 另 一 个 功能 ， 即 识别 功能 . 假设 在 状态 集合 日 
中 有 一 部 分 状态 称 为 终止 状态 ， 它 们 形成 @ 的 一 个 子 集 了 , fF 
Q. 控制 器 能 够 识别 出 当前 所 处 的 状态 是 终止 状态 , 或 者 不 是 终 
ERS. 我 们 可 以 将 这 个 识别 功能 看 成 为 有 限 自 动机 的 输出 . 

现在 假设 在 输入 带 上 有 一 个 有 限 符 号 弟 ， 其 符号 取 身 符号 信 
5S( 人 允许 重复 取 )， 这 个 符号 串 占 有 从 输入 带 左 端 第 一 个 方 格 开 始 
HETTAR. WATTS RA ©, 控制 器 从 状态 go 开始 读 入 
s 的 第 一 个 符号 , 并 按 上 面 所 说 的 方式 工作 ， 如 果 在 读 入 z 的 最 
后 一 个 符号 之 后 ， 控 制 器 的 状态 转移 成 集合 F 中 的 某 一 个 状态 ， 
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我 们 就 称 REO B = 为 这 个 有 限 自 动机 所 接受 "， 和 否则 , RIE o 
不 为 这 个 有 限 自动 机 所 接受 "， 换 和 句 话 说 ,一 个 有 限 自 动机 可 以 识 
别 出 哪些 符号 串 是 它 接受 的 , ROE BRS A BS HY. 

举 两 个 极端 情况 的 例子 .部 果 在 一 个 确定 性 有 限 自动 机 的 状 
TR 中, 每 一 个 状态 都 是 终止 状态 , HI Q—.F, WERZRA 
SRS 的 每 一 个 符号 出。 反之， 如 果 在 Q@ 上 没有 任何 一 个 状态 
是 终止 状态 ， 即 了 二 名 ( 空 集 )， 则 这 个 有 限 自 动机 不 接受 任何 一 
473m, 但 这 里 的 第 一 点 对 $1.3 中 更 为 一 般 的 有 限 自动 机 并 
不 成 立 . 

我 们 可 以 将 有 限 自 动机 的 上 述 识别 能 力 看 作 有 限 自 动机 的 一 
种 输出 。 即 对 于 每 一 个 输入 的 符号 申 , 作出 接受 或 不 接受 的 判断 ， 
这 就 是 它 输出 的 信息 . 


$1.2 关于 形式 语言 的 记号 和 概念 


将 一 个 给 定 的 有 限 自 动机 记 为 M, RA M 所 接受 的 符号 
串 全 体 所 成 的 集合 称 为 "由 女 接 受 的 一 个 形式 语言 ”， 记 为 
L(M). FERRETTI E, BRA SF (Word). 

在 型 为 有 限 骨 动机 时 ， 我 们 称 形 式 语言 并 (MI) 为 正规 语言 
(RGL), 我们 已 经 知道 两 个 正规 语言 : 一 个 是 由 取 自 符号 集 辟 的 
所 有 符号 串 全 体 所 成 的 语言 , 另 一 个 是 不 含 任何 符号 串 的 语言 ( 记 
AD, A BiB). 

正规 语言 是 形式 语言 中 最 简单 的 一 类 ， 由 于 形式 语言 是 本 书 
的 主要 工具 , 下 面 介绍 形式 语言 方面 的 一 些 记号 和 概念 . 

在 本 书 中 ,用 8 代表 由 有 限 个 不 同 符号 组 成 的 集合 ， 称 为 有 
限 符号 集 ， 例 如 {0}，{0, 4}， 等 等 ， 其 中 的 符号 0.1 等 不 作为 数 
字 来 使 用 , 如 有 其 他 含义 则 另行 说 明 . 

众人 中 到 有 限 个 符号 或 无 限 个 符号 ， 就 得 到 符号 串 ( 在 本 书 
中 , 符号 串 即 符号 序列 )， 如 不 作 说 明 时 ， 我 们 总 是 考虑 有 限 符号 
E, HER e 表示 不 全 任何 符号 的 符号 种 ， 称 为 空 昌 ， 它 在 形式 
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语 冯 中 的 作用 相当 于 数 0 在 算术 中 的 作用 .从 8 得 到 的 所 有 有 有 
限 符 号 上 串 的 全 体 记 为 S*， 我 们 总 是 认为 8€8". 

S* 的 任何 一 个 子 集 , 即 是 在 符号 集 8 上 的 一 个 形式 语言 。 由 
于 S" 月 身 和 空 集 好 也 是 S 的 子 集 ， 因 此 它们 都 是 5 上 的 形式 
语言 、 从 81.i 所 述 ，S* 入 都 可 以 出 有限 自动 机 所 接受 , 因此 
它们 都 是 正规 语言 。 这 里 要 注意 将 O 和 s 区 别 开 来 ， 3 是 不 食 
任何 串 的 一 个 语言 , 即 集 合 论 中 的 空 集 , 而 e 则 是 不 含 任何 符号 的 
zs. 
设 > 和 2 是 &S 中 的 两 个 符号 串 ， 那 么 把 它们 连接 (Oatena- 
tion) BAM ey BES 中 的 一 个 符号 串 ， 记 号 ;表示 将 个儿 
连结 而 成 的 串 , Ho i ERE, BUH a* 一 8， 符 号 串 2 的 长 
EE a PRAMS, WA lel, 4K, lel =o, 

如 果 存 在 串 w Ail oo, W o uvw, AR v RAK ”的 一 个 于 
$. Wh ue, Me o 是 epit BRE CProfix); 如 果 w—e, 则 称 
att oi —P SE (Suffix), RETR, 如 有 veo, 则 分 别 
称 2 为 wv 的 真子 串 、 真 前 级 和 真 后 组 . 

以 上 概念 均 是 对 有 限 符 号 串 而 言 的 。 当然 ， 可 以 将 这 些 概念 
ERAT SHEE, 这 里 没有 什么 困难 .自然 , 一 个 无 跟 符 号 
串 的 后 级 仍 是 一 个 无 限 符号 串 . 
$1.8 有 限 自动 机 前 数学 定义 及 其 推广 

一 个 有 限 自动 机 M, 是 指 一 个 五 元 组 : 

M — (Q, S, 8, go, F), 
其 中 @ 是 有 限 状 态 集 ，8S 是 输入 符号 的 有 限 集 ，goEQ 是 初始 状 
i», FO EA IRSE, RHEE SLL 中 都 已 讲 过 .现在 解释 5 
HEL SEMS RAA OHRA, WREE RRR E 
HEHE. pin, 在 图 1-1 中 的 转移 可 记 成 
g' = tg, a). 
HT OS 都 是 有 限 集 , HERAA dg Jp OL RT OH ARS X 
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AupEGE 1.0. 现在 可 以 由 $1.1 知道 , MRM A, WER 
Ba LMC BSS 
确定 ， 有 反之, MIR LCS 
是 一 个 正规 语言 ， 则 根据 
定义 ， 一 定 存在 一 个 有 中 
自动 机 M, fl L= L(A), 
自然 , 这 样 的 MRR 
一 的 . 

Be T LT © 48 S" 
TO AXERURH ZS, PAAR, PASAT S BRA 
Fi, 也 都 是 正规 语言 . 

前 面 已 经 提 到 ,上述 有 限 自 动机 也 称 为 确定 性 有 限 自动 机 . 现 
介绍 几 种 推广 . 

如 果 控 制 器 对 于 输入 符号 和 现 有 状态 的 转移 并 不 是 完全 确定 
的 ， 我 们 就 得 到 非 确定 性 有 限 自 动机 . RAK, Wig, we 
OXE, 35 函数 的 取 值 38(9， 四 可 以 多 于 一 个 , 也 可 以 没有 定义 ， 对 
图 1-1 而 言 ; 对 于 某 些 (9，5)， 控 制 器 可 以 转移 到 一 个 以 上 的 状态 
中 的 某 一 个 ， 也 可 能 对 另 一 些 (9，q)， 控 制 圳 的 状态 不 再 转移 ， 恋 
入 头 也 不 再 向 右 移 动 , 整个 自动 机 处 于 不 青 工作 前 停机 状态 . 

WTS ARS, TORR HS. ae ERR HA 
子 集 (包括 @ 和 好) 所 构成 的 集合 ， 那么, 非 确定 性 有 限 自 动机 中 
HAREA QS. 到 22 中 的 映射 . 

另 一 种 推广 称 为 " 带 有 e 转移 的 有 限 自动 机 ”这 里 的 o 即 是 
aH. 所 谓 s 转移 的 意义 ， 是 允许 在 不 读 入 符号 时 控制 器 的 状态 
就 可 以 发 生 转 移 ， 用 数学 语言 表示 , 6 是 定义 在 @x (SU{fel) 上 
的 多 值 映射 . 

以 上 两 种 推广 在 有 限 自 动机 的 理论 和 应 用 中 都 是 很 重要 的 手 


Bt. 
我 们 还 可 以 给 有 限 自动 机 增加 某 些 新 的 特征 ， 例 如 可 以 允许 
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读 入 头 左 移 ， 但 不 移出 给 入 带 的 左 端 ， 也 可 以 允许 读 入 头 停止 不 
动 , 同时 具有 不 确定 性 和 带 s 转移 等 特征 . 

对 于 以 上 三 种 推广 的 有 限 自动 机 ， 可 以 相应 地 定义 它们 所 接 
受 ( 或 识别 ) 的 形式 语言 , 其 具体 细节 可 参看 [1]。. 其 基本 思想 是 自 
然 的 ， 即 当 自 动机 读 入 一 个 串 儿 时， 只 要 存在 一 个 状态 转移 序列 ， 
使 得 当 读 完 “后 控制 器 能 进入 某 一 个 终止 状态 , 我 们 就 说 “we 为 自 
动机 所 接受 ”. 

重要 的 是 在 理论 上 已 经 证 明 ， 这 三 种 推广 都 没有 扩大 有 限 自 
动机 在 接受 形式 语言 方面 的 能 力 . 这 就 是 说 ， 从 接受 语言 的 能 力 
方面 来 看 ,每 一 种 推广 与 确定 性 有 限 自 动机 都 是 等 价 的 . 如 果 某 
一 个 语言 为 上 述 三 种 推广 中 的 茶 一 种 有 限 自 动机 所 接受 ， 那 么 也 
一 定 可 以 为 某 一 个 确定 性 有 限 自 动机 所 接受 . 

关于 这 个 重要 事实 的 证 明 , 可 参 奢 [1]、 此 外 , 文献 [ 引 ~ [6] 
也 都 有 参考 价值 . 


$1.4 状态 转移 图 


有 限 自 动机 的 状态 转移 图 是 很 直观 的 一 种 表示 方法 ， 它 是 我 

们 今后 研究 正规 语言 时 的 主要 工具 ， 
有 限 自 动机 的 状态 转移 图 是 一 个 有 限 有 向 图 ， 即 由 有 限 个 结 
点 和 有 向 弧 组 成 。 其 中 每 一 个 结 点 代表 自动 机 的 一 个 状态 ， 从 结 
点 到 结 点 的 有 向 台 ( 即 有 向 线段 /代表 自动 机 的 状态 转移 ， 在 有 向 
弧 上 标 以 相应 的 输入 符号 ， 表 示 控 制 嘎 由 绝 的 起 点 所 代表 的 状态 
在 读 入 这 个 符号 时 转移 成 由 


0 
on L(M) 弧 的 终点 所 代表 的 状态 .在 
TORDt 本 书 中 , 我 们 用 实心 小 贺 点 * 
了 代表 终 企 状态 ， 用 空心 小 贺 
G) Gi) Gti) ”点 。 代 表 非 终止 状态 ， 对 于 
B cde 代表 初 态 qo 的 结 点 ， 则 在 上 

述 圆 点 之 外 多 吉 一 个 加 图 ， 以 作 区 别 ， 
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Xx FE, 一 个 有 限 自 动机 并 = (Q, 8, 9, do, 万) 的 全 部 信息 都 
在 状态 转移 图 中 表示 出 来 ， 

图 1-2(i) 是 一 个 最 简章 的 确定 性 有 限 自 动机 。 它 只 有 一 个 
状态 , Q-F--igol, S={0, 1}, M. qo ili Kin Of 1 HAW 
AEA go E 1-2(ii) 是 转移 函数 Ó 的 表格 表示 .图 1-2 (ili) Jul 
是 语言 LM) WERZA $1.5), 

从 代表 初 态 qo HIG Ex AZ. HEE PRAT GA — A 2 
点 ， 然 后 继续 这 样 做 下 去 ， 就 得 到 从 go 出 发 的 一 条 路 径 ， 我 们 将 
一 条 路 和 色 中 所 含 的 有 向 弧 的 个 数 称 为 路 径 的 长 度 .。 由 于 每 一 个 有 
向 强 都 标 有 一 个 输入 符号 ， 因 此 一 条 路 径 就 对 应 于 有 限 自动 机 的 
一 个 输入 符号 串 ， 俩 如, 在 图 1-30) 

do — go —> go — go — ge 

代表 长 度 为 4 的 一 条 路 径 ， 它 对 应 于 输入 符号 串 0010， 采 用 这 样 
的 方法 ， 很 容易 在 有 限 各 动机 的 状态 转移 图 上 判定 一 个 符号 溃 = 
是 否 为 这 个 自动 机 所 接受 ， 也 就 是 说 , 只 要 观察 从 出 发 与 串 4 
对 应 的 路 径 的 终点 是 否 是 一 个 终止 状态 ， 对 于 非 确定 性 有 限 自动 
机 来 说 , 与 串 对 应 的 路 径 未 必 只 有 一 条 , 只 要 存在 合乎 上 述 要 求 
的 一 条 路 径 就 认为 = 为 自动 机 所 接受 图 二 2( 世 的 有 限 自 动机 所 
接受 的 语言 显然 就 是 S*, 其 中 S={0, 1}, 


§1.5 正规 表达 式 


正规 语言 可 以 用 正规 表达 式 写 出 来 , 这 在 有 时 是 很 方便 的 ， 
先 介绍 构成 正规 表达 式 的 三 种 运算 . 
设 Li, Ls fille 是 符号 集 上 的 三 个 形式 语言 ， 定 义 1 与 
Le 的 和 ( 即 “ 并 ”) 为 
L4cLa-íziÓe€La3X CL, 
Li $0 Lo HAIER”) A 
IaLa= {eyl vE Li, y€ Le}, 


由 此 可 以 定义 语言 工 的 赫 为 
To={ej， 了 =-TT él, 
这 里 {8} 是 只 含 的 语言 , ES OAR, 
第 三 种 运算 是 工 的 闭 包 , 定义 为 
L'-| L, 

现在 可 以 用 递归 方式 定义 在 S 上 的 正规 表达 式 : 

1. D RE BUR Mox, 代表 空 集 . 

2. e 是 正规 表达 式 , HORE FUE IR e 的 语言 {8}, 

8. BPS CCS 是 正规 表达 式 ， 代 表 具 含 2 这 一 个 串 ( 长 
BEA Diii ster. 

4 如果 和 上 是 代表 正规 语言 召 和 了 的 两 个 正规 表达 式 ， 
Witt) (HAG IDNBREKER R+T, RT 和 B" 的 正规 表 
AK, l 

正规 表达 式 就 是 由 De 和 5 中 的 符号 出 发 , 有 限 次 使 用 上 述 
三 种 运算 和 括号 “(*、“)” 构 成 的 表达 式 ， 图 1-2(iii) 即 是 语言 
10, 1}* 的 正规 表达 式 (0 二 DD*. 

关于 正规 表达 式 的 最 重要 结果 , BE AAR DOL Se: 
每 一 个 正规 语言 可 以 用 正规 表达 式 表 示 ; 反之 , 每 一 个 正规 表达 式 
代表 一 个 正规 语言 . 

在 文献 [1] 中 给 出 了 从 有 限 自 动机 型 HERRES DOM) IE 
规 表达 式 的 计算 方法 ， 也 给 出 了 从 正规 表达 式 构 造 相 应 的 有 限 户 
动机 的 方法 . 


(i) (ii) 
m 1-3 


图 1-3 中 给 出 了 接受 语言 
L-1(0^1"|nz0, m>0} 
的 两 个 有 限 自动 机 , LEM AeA OL", HH (i) RE e 转 
移 的 非 确定 性 有 限 自 动机 ，《ii) 是 确定 性 有 限 自动 机 ， 


$1.6 GARBER 


正规 语言 还 可 以 用 某 种 语法 规则 生成 . 一般 的 语法 系统 是 一 
个 四 元 组 G — (V, 8, P, s), 其 中 下 AS 都 是 有 限 符号 集 , PR 
语法 规则 集 , SEV Rwjfpe. RVNS=O, KV PHASA 
变量 或 非 终结 符 , BS 中 的 符号 为 终结 符 . 

BEEP 中 的 每 一 条 规则 都 属于 以 下 两 种 形式 ， 

A—BB 或 Af, 

其 中 A BCY, BCS*, 则 我 们 称 G 为 右 线性 语法 . 

从 so 出 发 ， 有 限 次 应 用 中 的 规则 后 , 得 到 完全 由 终结 符 组 
成 的 串 ， 称 为 “由 诸 法 好 生成 的 一 个 字 ”， 所 有 这 样 的 字 的 全 体 ， 
称 为 “出 语法 他 生成 的 形式 语言 ”， 记 为 LG), 

这 方面 的 基本 结果 是 : 一 个 形式 语言 工 为 正规 语言 的 充分 必 
要 条 件 是 存在 一 个 右 线性 语法 C, 使 C= 上 L(G). 

以 下 举 几 个 简单 例子 . 

对 于 工 = +1)", WAAS V = (so), S —(0,1], P= (so Oso, 
so -> 1so, $9— 8]. 

x L-0*5 TLS V= {so si}, 8-410, 1), P= (so Oso; 
So->8, So—> 191, $1 181, $1— 8}, 


关于 左 线 性 语法 和 和 它 与 正规 语言 的 关系 , 可 参看 [1]， 


$1.7 正规 语言 的 泵 引 理 


36313 (Pumping Lemma) 是 一 个 形式 语言 为 正规 语言 的 必 
要 条 件 ， 它 在 证 明 某 些 语 言 不 是 正规 语言 时 是 很 有 用 的 . PEDE 
述 这 个 引 理 , 并 举例 说 明 其 应 用 方法 , 


引 理 如 果 工 是 正规 诺 言 ， 则 存在 一 个 只 与 工 有 关 的 整数 
n, 它 具 有 下 列 性 质 ; HEW zEL, Hle >n, PE z 的 一 个 分 解 
z=uvw, luo <n, || 1, Axe 220 (8 uve CL py. 

(f 1] L={0"|¢>0} AEM. 

HRES. W LEERS, 则 存在 引 理 中 所 说 的 整数 ,我 
们 取 x=0”。 因为 |z|>n， 因 此 存在 分 解 z=wow， 使 [wv| 所 % 
loji, uv'wC€ EL, Hi uw?w 的 长 度 满足 条 件 

P< | we? | « 2"-4- n, 
但 从 worn C L np J, KE uw] pg 343 2 ASE EK, SIE. 

[ 例 23j L-—41010 621 AE EMBER. 

用 反 证 法 ， 如 工 为 正规 语言 , 则 存在 引 理 中 所 说 的 整数 %. 取 
z-0"'10, RUE I z= uow, Bun |vo|z1,wwwcLs 
PORN, AT we cvüdkdkc dH Hi Op, pE il Ri 
uva) PARE dE TEE ig) PS MRA PR SO, 这 与 
uvwe L FR. 


$1.8 自然 等 价 关 系 Ru 


在 正规 语言 研究 中 的 另 一 个 重要 关系 ， 是 下 面 将 介绍 的 自然 
等 价 关 系 Ry MILA IRAE HEE BE (Myhill-Nerode Theorem), 

任意 给 定 一 个 形式 语言 LES*， 这 里 工 不 一 定 是 正规 语言 . 
RA L, 可 以 在 S" 中 引入 一 个 等 价 关 系 R. Boyes", meet 
每 个 zE S", Bi oc A y REMAT L, 或 者 都 不 属于 L, 我 们 就 称 
c yd Ry SH, 记 为 vzRry. 

容易 验证 这 样 定义 的 Bi, BME PSH KA, WER 
fe(o Ro) IPPEG Ry — y Roo) WE BER Ly, yEye—oBiz), 
我 们 称 Ri 是 “由 语言 工 引 出 的 自然 等 价 关系 ” 

R 具有 右 不 变性 质 : 

shiy = zzHiuym d 


Jd 2c68* 是 任意 符号 惠 . | 

等 价 关系 BL St 分 成 若干 个 等 价 类 ， 记 zE&* 所属 的 等 
价 类 为 [z]。 将 等 价 类 的 个 数 称 为 Rr 的 指标 如果 R 的 等 价 类 
有 无 限 多 个 ， 则 称 BL 的 指标 为 无 穷 大 指标 的 重要 性 体现 在 下 
列 定理 中 (其 证 明 可 参看 [1]): 

迈 希 尔 - 宗 罗 德 定理 Gr ES"， 工 为 正规 语言 的 充分 必要 
条 件 是 RL 的 指标 为 有 限 数 。 又 如 工 为 正规 语言 ， 则 接受 工 的 最 
小 确定 性 有 限 自 动机 的 状态 个 数 就 等 于 Br 的 指标 . 

这 里 所 讲 的 最 小 确定 性 有 限 白 动机， 基 指 接受 同一 个 正规 语 
言 工 的 所 有 确定 性 有 限 自动 机 中 状态 个 数 最 小 的 一 个 ， 今 后 往 
往 简 称 它 为 最 小 有 限 自动 机 . 

在 [二 中 给 出 了 从 Br 等 价 类 出 发 构造 最 小 有 限 自动 机 的 计 
算 方 法 ， 同时 可 以 证 明 , 接受 每 一 个 正规 语言 的 最 小 有 限 官 动机 
是 唯一 存在 的 。 关键 的 一 步 是 用 等 价 类 作为 自动 机 的 状态 , 这 时 
Rr 的 定义 具有 明显 的 自动 机 意义 ， 定 理 的 证 明 是 容易 的 ， 现 在 重 
新 讨论 上 面 的 例子 ， 

WF L-(0"|ó20), 任意 取 两 个 字 0" M0", dj n 
=O", yi 075 — EL, WE 072 =O?" 它 的 指数 2/-- 2! GS JE 2 的 
HE, AO EL, HGR BL 的 定义 , BLO” RO 不 能 成 立 .这 样 
我 们 就 知道 工 中 的 无 穷 多 个 字 分 属于 RL 的 不 同等 价 类 , 因此 RL 
不 是 有 限 指标 的 等 价 关系 。， 从 迈 希 尔 - 奈 罗 德 定理 可 见 卫 不 是 正 
规 语言 . 

WE L= OL s>1}, Riles BE, 1}* 中 所 有 形状 为 
oi g El, WO GO, 60-3, X4 z— 10! RA ORLO 不 
能 成 立 ， 这 样 就 可 推出 BL 不 是 有 限 指标 的 等 价 关系 , 因而 工 不 
是 正规 语言 

与 泵 引 理 不 同 之 处 是 可 以 用 Rt 和 近 希 尔 - 奈 罗 德 定理 来 证 
明 其 些 语言 是 正规 语言 ， 并 且 可 以 确定 接受 这 个 语言 的 最 小 有 限 
自动 机 ， 

il 


$1.9 封闭 性 质 


将 正规 语言 类 记 为 多 (RG)， 在 某 些 应 用 中 知道 (RG) 关 
于 哪些 运算 为 封闭 是 很 重要 的 . 以 下 列举 这 方面 的 几 个 结果 , 并 
作 些 说 明 . 

i. (RG) 关 于 语言 的 和 、 连 接 和 和 烧 包 这 三 种 运算 是 封闭 
的 ， 这 从 正规 表达 式 的 定义 就 可 以 得 到 证 明 (参见 $1.5)， 一 般 ， 
称 这 三 种 运算 为 正规 运算 、. 

2. 将 符号 串 z-—aiur-a, 反 序 得 到 的 符号 串 as…asar 记 为 
z^, $n cdm X LCS' f L'"—(G"Izc Lg L f 9 R, 
< 和 (RH 关于 镜 象 运算 是 封闭 的 . 这 可 以 从 工 的 正规 表达 式 出 发 
来 证 明 , 只 要 将 这 个 正规 表达 式 中 有 关连 接 运算 的 因子 硕 序 王 倒 ， 
就 得 到 L* 的 正规 表达 式 . 

3. MLSS, WE L =S- E LHi -Z (CRG) 关 于 社 运 
算是 封闭 的 . 实际 上 ， 如 有 工 = 工 (到 )， M 为 确定 性 有 限 自 动机 
(Q, 8,8, go, F), WRES F'=Q-F M =Q, 8, 5, go, F^), 
就 得 到 L'—LCM?), 

4. Gb ROS 为 正规 语言 ， 对 每 个 6€S, HRCA HEM 
语言 ， 这 里 4 机 以 是 与 S 不 同 的 有 限 符号 集 ， HR pets 
Grtz an FRM Wiws Wa Hep ow; RS, Kian XERA RA 
到 一 个 新 的 语言 .我 们 称 这 样 的 运算 为 置换 . 用 正规 表达 式 容 易 证 
BY -多 (RG) 关 于 置换 运算 是 封闭 的 

5， 如 果 上 述 每 个 Bs 只 由 一 个 字 组 成 ， 则 称 这 样 的 置换 为 同 
B. KEM NAR ZIRGXTIEdBPPR dumis ER 
中 将 多 次 出 现 . 

6. MAMA, MEPS, A MEA, MFBA LC 
a, 定义 

A (L) -(z|A(2) € L}, 
PRA LALEZAR. TLEH SROKA HBB 
i2 


Fi. 
7T. WF LSS, 定义 
MIN(L)— («€ L|» WHET XERI AUR RT L}. 
利用 有 限 自动 机 容易 证 明 : (RO) AT MIN 运算 是 封闭 的 。 


$2 ERES 


本 节 中 将 对 非 正 规 语言 采用 31.1 中 的 方法 , 即 用 某 种 自动 
机 作为 接受 或 识别 语言 的 装置 。 随 着 自动 机 的 复杂 程度 的 增加 ， 
可 以 得 到 越 来 越 复 杂 的 语言 。 在 下 一 节 将 介绍 生成 语法 的 方法， 
它 是 $1.6 的 右 线性 语法 的 推广 。 本 节 的 内 容 可 参看 [1]~[6]. 


$2.1 一 般 性 讨论 


可 以 设想 , 要 "设计 ”出 接受 非 正规 语言 的 自动 机 , 无 疑 需 要 突 
破 有 限 自 动机 的 限制 。 从 $ 知道， 有 限 自动 机 的 主要 特点 是 TA 
AAR, 不 需要 记忆 装置 , 对 于 输入 带 上 的 信息 只 有 读 入 的 功能 . 
从 31.8 中 的 自然 等 价 关 系 BL 和 过 希 尔 - 奈 罗 德 定理 知道 ， 如 工 
为 非 正规 语言 ， 则 有 无 限 多 个 Bz 等 价 类 . 利用 这 个 定理 的 证 明 
方法 (参见 [11), 用 每 一 个 等 价 类 作为 一 个 状态 , 就 可 以 构造 出 接 
受 工 的 一 个 无 限 自动 机 好 .这 个 自动 机 除了 具有 无限 多 个 状态 
之 外 , 在 其 他 方面 与 $1 介绍 的 有 限 自 动机 完全 一 样 , 而 且 是 确定 
性 的 . 
容易 看 出 , 这 样 的 推广 在 概念 上 虽然 是 简单 的 , 但 在 实际 上 却 
很 困难 , 因为 它 违 反 了 有 限 描 述 的 原则 .。 由 于 存在 着 无 限 多 个 可 
能 状态 , 状态 转移 函数 3 一 般 也 不 能 用 有 限 描述 的 方法 来 给 出 . 
无 限 自动 机 的 实际 发 展 过程 采 取 了 与 上 述 推广 完全 不 同 的 做 
法 . 这 里 所 采取 的 方法 是 增强 自动 机 的 记忆 能 力 ， 增 加 读 入 头 的 
功能 等 等 ， 但 仍然 保持 控制 器 的 可 能 状态 为 有 限 的 特征 ， 对 于 每 
一 时 刻 的 机 器 动作 , 也 只 允许 做 有 限 件 事 情 ,这 祥 的 限制 是 很 自然 
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的 . 如 果 人 允许 机 器 在 有 限时 间 内 完成 无 限 多 件 工作 , 这 并 不 会 带 来 
任何 有 实际 价值 的 结果 ， 

因此 , 对 于 下 面 要 介绍 的 无 限 自动 机 , 其 中 的 所 谓 "无 限 是 一 
种 潜在 的 无 限 . 事实 上 ， 这 种 无 限 在 有 限 自 动机 中 也 已 存在 、 例 
如 , 在 $1,1 中 输入 带 右 方 的 长 度 是 不 受 限 制 的 ， 这 就 是 说 ， 虽然 
每 一 个 输入 符号 串 的 长 度 是 有 限 的 ， 但 有 限 自动 机 所 处 理 的 符号 
申 的 长 度 是 不 受 限 制 和 的 。 从 语言 的 识别 上 来 看 也 是 如 此 ， gM 
是 一 个 有 限 自 动机 , LMES, WI M feSEXIES* 中 的 每 一 个 符号 
串 作 出 接受 或 不 接受 的 反应 ， 由 于 S* 中 有 无 限 多 个 符号 串 , 不 可 
能 用 逐个 检验 的 方法 来 求 出 LM). Bin b— Bn, M 是 能 有 
限 描述 的 ， 我们 可 以 从 M 的 定义 出 发 ， 应 用 各 种 数学 工具 来 确 
定 它 所 接受 的 语言 , 研究 它 的 性 质 . 因此 , 下 面 要 介绍 的 各 种 无 限 
自动 机 是 在 复杂 程度 上 的 增加 , 而 状态 个 数 仍 为 有 限 . 


$2.2 下 推 自动 机 


现在 观察 图 2-1 中 的 下 推 自动 机 的 示意 图 ， 与 图 1-10i) 中 
的 有 限 自动 机 相 比 较 ， 主 要 是 多 了 一 个 下 
推 存储 器 和 用 于 读 写 其 中 内 容 的 读 写 头 . 
PTE FA ae HERR Stack), RUE 
进 先 出 区 . 它 是 计算 机 中 常用 的 一 种 技 
: TR. 它 的 特点 是 ， 新 来 的 数据 《 即 符号 ) 总 
图 2-1 是 加 在 原 有 数据 上 面 ， 而 将 原 有 有 内容“ 下 
推 一 格 ; 反之 , 在 去 掉 最 上 面 一 格 中 的 符号 之 后 , 其 祭 符 号 的 位 置 
全 都 上 升 一 格 。 同时, 控制 器 只 能 读 出 最 上 面 一 格 中 的 符号 , 或 者 
将 新 的 符号 写 入 其 中 ， 如 图 2-I 所 示 ， 控 制 器 的 读 写 头 总 是 处 在 
堆栈 的 最 上 面 一 格 的 位 置 上 . 堆栈 的 这 种 工作 方式 也 称 为 "后 进 
先 出 ”或 “先进 后 出 ”因为 较 早 在 入 到 堆栈 中 的 符号 的 位 置 总 是 
在 较 晚 存 入 的 符号 位 置 的 下 方 , 所 以 , 只 有 当 在 它 上 面 的 符号 均 被 
去 掉 之 后 ， 较 量 进入 堆栈 的 符号 才 会 上 知 到 控制 器 的 读 写 头 可 以 
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直接 扫 撕 的 位 置 . 

如 图 2-1 所 示 , 堆栈 在 下 方 的 长 度 基 没有 限制 的 , 从 而 提供 了 
潜在 元 限 的 记忆 人 能力， 与 输入 带 一 样 , 堆栈 划分 为 方 格 , 在 每 一 个 
方 格 中 存放 一 个 符 导 .堆栈 可 以 使 用 与 输入 符号 集 不 同 的 一 个 有 
BA S, 

与 有 限 自动 机 不 同 ， 控 制 器 的 状态 转移 除了 与 输入 带 上 当时 
读 入 的 符号 和 自身 状态 有 关外 ， 还 与 当时 从 堆栈 最 上 一 格 读 入 的 
MSAK. ibh 除了 实现 状态 转移 和 读 入 带 右 移 一 烙 之 外 , 还 可 
以 将 一 个 符号 串 写 入 堆栈 中 去 ， 还 多 许 在 不 读 入 输入 带 符号 和 输 
入 头 不 右 移 的 情况 下 对 堆 乒 进行 读 配 ， 

下 以 与 有 限 自 动机 相仿 地 取 定 某 些 状态 为 终 正 态 ， 然 后 定义 
一 个 输入 符号 串 是 否 为 下 推 自动 所 所 接受 . 这 样 底 可 以 进一步 定 
义 由 一 个 下 推 自 动机 所 接受 (或 识别 ) 的 形式 语言 .我 位 称 这 样 的 
语言 为 上 下 文 无 关 语 言 (QFIL)， 并 将 上 下 文 无 关 语 言 全 体 所 构成 
inis aux -ZOF. 

已 经 知道 有 包含 关系 

J'(Ra)C (OF), 
而 且 这 里 的 包含 关系 为 真 包含 ， 实际 上 ， 存 在 着 大 量 的 上 下 文 无 
XS, 它们 不 是 正规 语言 , 即 不 能 为 任何 有 限 自 动机 所 接受 ， 因 
此 可 以 说 下 推 自动 机 的 计算 能 力 比 有 限 自 动机 强 ， 而 上 下 文 元 关 
语言 比 正规 语言 更 为 复杂 . 


$2.3 有 两 个 堆栈 的 下 推 自动 机 


实际 上 有 很 多 种 方法 可 以 进一步 增强 自动 机 的 计算 能 力 ， 即 
识别 更 为 复杂 的 语言 的 能 力 ， 从 下 推 自动 机 来 并， 虽然 它 有 一 个 
堆栈 作为 存储 器 ， 但 堆栈 的 先进 后 出 工作 方式 与 一 般 的 随机 存 取 
存储 器 相 比 , 远 为 不 便 . 

然而 , 只 要 再 增加 一 个 堆栈 , 如 图 3-2 所 示 , 情况 就 大 为 不 同 ， 
这 里 的 控制 器 有 两 个 读 写 头 , 分 别 与 范 个 堆栈 打交道 ， 其 中 , 有 一 
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个 堆栈 同时 用 作 输 入 带 ， 即 在 开始 时 在 这 个 堆栈 中 放 有 输入 符号 
串 ， 而 且 将 第 一 个 符号 放 在 堆栈 的 最 上 面 
的 方 格 中 , 然后 依次 往 下 存放 .， 这样, 就 使 
自动 机 可 以 按 输 入 符号 串 的 自然 顺序 谈 入 
它 ; 但 在 工作 中 控制 器 还 可 以 改写 这 个 堆 
栈 中 的 内 容 . 因 此 , 它 不 仅仅 是 作为 输入 带 
图 22 来 使 用 的 . 

这 里 不 准备 进一步 讨论 具有 两 个 堆栈 的 下 推 自动 机 .如 果 注 
意 到 从 一 个 堆栈 顶部 方 格 中 去 掉 的 符 续 可 以 “下 推 "到 第 二 个 堆栈 
中 去 ， 就 很 容易 证 明 具 有 两 个 堆 乒 的 下 推 自动 机 的 计算 能 力 与 下 
面 要 介绍 的 具有 最 强 计算 能 力 的 图 灵机 (Turing Machine) 相同 ， 
己 经 知道 , 增加 更 多 的 堆栈 或 其 他 存储 器 , 都 不 可 能 得 到 计算 能 力 

更 强 的 自动 机 . 


$2.4 图 灵机 


在 90 年 代 中 期 ， 图 灵 (A. M. Turing) 考 虑 了 可 计算 性 和 自 
动 计算 机 的 一 般 定义 ， 提 出 了 现在 被 称 
为 图 灵机 的 概念 (参见 [7])， 图 灵 袖 的 “Liel [一 一 
最 简单 形式 如 图 2-8 所 示 。 它 与 $1 中 
介绍 的 有 限 自动 机 都 由 一 个 状态 有 限 的 
控制 器 和 一 条 划分 成 方 格 的 输入 带 组 图 2-3 
成 ， 但 这 里 的 控制 器 是 通过 一 个 读 写 头 与 输入 带 发 生 联系 的 ， 这 
样 , 它 就 不 仅 可 以 从 方 格 中 读 入 符号 , 而 且 还 可 以 按 控制 器 的 指令 
将 一 个 符号 写 入 到 这 个 方 格 中 去 . | 

设 输入 带 左 方 是 有 限 的 ， 从 左 端 第 一 个 方 格 开 始 依次 存放 输 
入 符号 串 ， 读 写 头 在 一 开始 时 扫描 左 端的 第 一 个 方 格 ， 图 灵机 的 
工作 方式 可 以 用 映射 8 KER, CHU, ORA, a, m), 其 中 
g 是 当时 的 控制 器 状态 .6 是 读 写 头 从 输入 带 上 读 入 的 符号 ， 映 
So 表示 图 灵机 根据 (9, o) 要 做 三 件 事 ， 将 控制 器 的 状态 转移 成 


lő 


taadi (g'ad m) 


d 通过 读 写 头 将 符号 o 写 入 到 符号 < 所 处 的 方 格 中 , 决定 读 写 头 
往 左 或 往 右 移动 一 个 方 格 ， 这 里 用 m 取 工 ( 左 ) 或 R( 右 ) 来 代表 这 
两 种 可 能 性 ， 在 写 入 过 程 中 ， 如 6 一 a'， 即 意味 着 保持 方 格 中 原 有 
的 符号 不 变 . 

以 上 虽然 是 最 简单 形式 的 图 灵机 ， 但 已 经 证 明 它 与 图 灵机 的 
其 他 各 种 形式 在 计算 能 力 上 是 等 价 的 . 

与 有 限 自动 机 相 比 的 另 一 个 不 同 之 处 是 ， 图 灵机 不 仅 可 以 利 
用 输入 带 上 一 开始 存放 有 输入 符号 串 的 那 一 部 分 ， 而 生还 可 以 利 
用 在 输入 带 上 的 其 余部 分 ， 由 于 输入 带 在 右 方 的 长 度 没有 限 H, 
因此 就 提供 了 无 限 的 记忆 能 力 ， 我 们 假定 在 开始 时 于 输入 符号 串 
右 方 的 每 一 个 方 格 中 都 放 有 一 个 特殊 的 空白 符号 B， 并 规定 BA 
在 输入 符号 集中 . 

与 过 去 一 丹 ， 将 控制 器 的 状态 集 记 为 @， 并 且 用 OF RHO 
中 的 终止 状态 组 成 的 子 集 ， 我 们 就 可 以 定义 由 图 灵机 接受 (或 识 
别 ) 的 符号 上 串 和 形式 语言 

我 们 称 图 灵机 接受 的 形式 语言 为 虽 归 可 枚 举 语言 (REL)， 将 
所 有 递归 可 枚 举 语言 构成 的 形式 语言 类 记 为 .多 (RBE)， 把 这 样 的 
表 言 明知 “可 枚 举 * 的 理由 ， 是 指 可 以 用 一 个 图 灵机 将 语言 中 所 有 
的 字 逐 个 打印 出 来 ， 即 将 所 有 字 枚 举 出 来 . “递归 ?这 个 词 与 下 面 
要 提 到 的 可 计算 性 理论 有 关 . 

我 们 还 需要 知道 , 图 灵机 可 以 作为 真正 的 计算 机 来 使 用 ， X 
Mb, 这 是 提出 图 灵机 的 原来 目的 ， 固 定 一 个 自然 数 为 TORS 
灵机 来 计算 函数 (do, …，)， 其 中 每 个 自 变 量 只 取 非 负 束 
数 , 函数 值 也 是 如 此 . 计算 的 方法 是 在 输入 带 上 一 开始 放 有 符号 审 

0*10*1...10^, 
然后 图 灵机 开始 工作 。 如 果 当 图 灵机 停机 时 ， 不 论 控制 器 是 否 处 
于 终止 状 态 , 只 要 输入 带 上 的 符号 串 为 0", 我 们 就 定义 
flir, do, s, 94) =m, 
我 们 称 这 样 的 函数 为 部 分 递归 函数 ， 显然 , 了 不 一 定 对 自 变量 的 
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每 一 组 值 都 有 定义 . 

这 个 概念 的 重要 位 可 以 从 以 下 论题 虱 出 ; 

E35-Hz iK Ohureh-Turing Thesis) [i fii 6A 
部 分 递归 函数 , PLATA RAL PERI E t 

需要 说 明 的 是 ,可 计算 ”万 是 我 们 的 一 种 直观 概念 , 并 非 数学 
AE X. HE, 这 个 论题 不 可 能 从 数学 上 得 到 证 阴 ， 反 之 , 如 果 能 找 
到 一 个 直观 上 可 计算 的 函数 ， 并 且 证 明 空 不 能 为 任何 图 灵机 所 计 
算 , 则 就 可 以 推翻 乒 奇 - 图 灵 论 题 ， 但是, 至 今 为 止 , 还 没有 发 生 这 
样 的 事情 ， 从 已 经 党 试 过 的 种 种 可 计算 性 理论 来 看 ， 都 支持 上 述 
3E BEES IE RE, 

关于 图 灵机 的 另 一 个 重要 结果 是 , 存在 一 类 通用 图 灵机 , 如果 
将 任何 一 个 图 灵机 的 有 限 描 述 和 输入 符号 串 也 用 一 定 的 方法 
写成 一 个 符号 申 , 然后 输入 到 一 个 通用 图 灵机 中 去 , 则 通用 图 灵机 
wl Ay BS RL M 在 输入 凤 时 的 全 部 动作 . 
$2.8 递归 语言 与 非 递 归 可 枚 举 语 言 

从 部 分 递归 函数 的 定义 可 见 , 24 3E 61 EIE EEG (Ga, da, n, ty) 
不 居于 了 的 定义 域 时 , 图 灵机 有 可 能 不 停机 ， 这 样 , 我 们 就 无 法 关 
道 一 个 正在 作 计算 的 图 灵机 是 否 会 最 终 计 算出 结果 来 . 从 这 个 意 
义 上 说 ,上述 可 计算 酒 数 并 不 是 能 行 可 计算 的 . 

dm AR HS RL SERE SEC n do, +, 42 WH-A HE E RE 
值 都 有 定义 ， 则 称 了 为 全 递归 函数 . 这 时 的 计算 不 存在 上 述 停机 
PAE, 因此 了 是 能 行 可 计算 的 . | 

与 此 相应 地 , 在 递归 可 校 举 语言 类 (RE) PA-+ ATA, 
称 为 递归 语言 类 ， 称 一 个 语言 工 为 六 归 语言 ， 如 时 至 少 存在 一 个 
图 灵机 接受 L, 同时 这 个 图 灵机 对 所 有 输入 都 一 定 会 停机 , 其 中 包 
括 接 受 工 中 的 符号 如 的 停机 在 内 . 

另 一 方面 , 容易 说 明 存 在 非 递 归 可 枚 举 语言 . 

因为 每 一 个 图 灵机 的 有 有限 描述 都 可 以 按 一 定 的 方法 编码 成 各 
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不 相 园 的 符号 串 ， 所 以 , 图 灵机 全 体 只 有 可 列 个 . 这 表明 SACRE) 
为 可 列 集 , 即 所 有 递归 可 枚 举 语 言 一 共 上 只 有 可 列 个 . 

根据 “形式 语言 即 是 S* 的 子 集合 ”的 这 个 定义 , 可 知 形式 语言 
有 不 可 列 个 ， 这 就 说 明 , 存在 着 大 量 的 非 递归 可 枚 举 语言 , 它们 不 
可 能 为 任何 图 灵机 所 接受 ， 在 这 个 意义 上 , 我 们 说 这 种 语言 的 复 
杂 性 是 不 可 计算 的 . 

相应 地 , 存在 大 量 的 不 可 计算 函数 , 即 不 可 能 用 任何 图 灵机 来 
计算 的 函数 . 


$2.6 线性 有 和 界 自 动机 


已 经 知道 有 包含 关系 
LOPIELRD), 
而 且 是 真 包含 关系 . 

实际 上 , 图 灵机 的 计算 能 力 要 比 下 推 自动 机 强 得 多 . 我 们 还 需 
要 介 于 这 两 类 自动 机 之 问 的 另 一 类 无 限 自 动机 ， 辐 对 介绍 它 所 接 
受 的 一 类 新 的 形式 语言 . 

对 图 灵机 增加 两 个 限制 : 

1° 在 输入 符号 集中 增加 两 个 符号 4 和 利用 作为 输入 符号 串 
的 左 限制 符 和 右 限 制 符 . 

2° 控制 器 的 读 写 头 不 允许 从 符号 ?向 左 移动 , 也 不 允许 从 符 
SS MAB, 也 不 允许 改写 这 两 个 符号 ， 

可 以 证 明 ， 以 上 限制 等 价 于 图 灵机 在 识别 一 个 长 度 为 的 输 
ATES BI, 所 使 用 的 存 赃 容量 不 超过 "的 一 个 国定 倍数 . 

我 们 把 这 禅 的 图 灵机 叫做 线性 有 界 自 动机 , 同时 , 把 线性 有 界 
自动 机 所 接受 的 形式 语言 叫做 上 下 文 有 关 语 言 4QSL)。 将 所 有 上 
下 文 有 关 话 言 所 构成 的 语言 类 记 为 (OS), 

可 以 证 明 ( 参 见 [1]、[2]、 [5], [6]) 

Z(RG)G Z(OF)g.Z(O8)t V (RE) | 
此 外 , -Z (OB) E BH RAAT. 


558 1.8 相仿 , 可 以 给 出 非 确定 性 下 推 自动 机 、 非 确定 性 有 给 
自动 机 和 非 确定 性 图 灵机 的 定义 . 

关于 线性 有 界 自 动机 的 一 个 未 解决 问题 是 ， 确 定性 线性 有 界 
自动 机 和 非 确定 性 线性 有 界 自动 机 在 接受 (或 识别 ) 语 言 的 能 力 上 
是 否 等 价 . 在 $1.3 已 经 指出 , 对 有 限 自 动机 来 说 ,相应 问题 的 同 
答 是 肯定 的 .已 经 知道 , 对 于 图 灵机 来 说 情况 也 是 如 此 ， 但 是 , 对 
于 下 推 自动 机 , 相应 问题 的 回答 却 是 否定 的 .我 们 将 确定 性 下 推 自 
动机 所 接受 的 语言 称 为 确定 性 上 下 文 无 关 语 言 (DOFL)， 它 构成 
为 .2Z(OF) 中 的 一 个 真子 类 . 


$3 让 成 语法 系统 


本 节 从 生成 语法 系统 ( 即 短语 结构 语法 系统 ) 的 角度 介绍 在 
8 2 中 引进 的 各 类 非 正规 语言 的 一 些 基本 性 质 ， 有 关 事 实 的 证 明 ， 
可 参看 [1] ~[6]. 


$3.1 放言 的 草 姆 斯 基层 次 


在 81.6 中 己 经 指出 ， 正 规 语言 可 以 用 右 线性 语法 生成 。 现 
在 介绍 关于 非 正规 语言 的 生成 语法 理论 . 

WEH G.— (V, 8, P, so) 称 为 一 个 生成 语法 , 或 短语 结构 语 
ik, Mop 六 是 变量 (或 非 终 结 符 ) 的 有 限 集 ，S 为 终结 符 的 有 限 
集 , VAS= Ø, SEV HPR, 卫 为 语法 规则 ( 即 生 成 规则 ) 的 
ARR. 每 一 条 规则 的 形式 为 a 一 B, 其 中 a 和 BB 都 属于 (VU 
Sy, 在 中 至 少 全 有 六 中 的 一 个 变量 . 

从 初始 符 so 出 发 , 有 限 次 应 用 卫 中 的 语法 规则 所 得 到 的 符号 
E =“ 如果 完 全 由 终结 符 组 成 ， 即 CS, MR o EUER 从 生成 
的 一 个 字 ( 或 符号 串 )”， 由 全 生成 的 所 有 字 的 全 体 , 作为 S"* 的 一 
TTR, BABE G 生成 的 语言 , iO LO). 

在 $1.6 已 经 介绍 过 一 种 特殊 的 生成 语法 , 即 右 线性 语法 . UE 
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房 生 成 的 语言 为 正规 活 寺 . 

现在 叙述 语法 规则 的 一 般 应 用 方式 ， 

Heye US. 如 果 存 在 分 解 式 2an Fil y= o1 B a, 
FIRJ, 在 三 中 有 -~ 条 规则 为 — 8, 则 我 们 说 y 是 “从 o 出发, 经 过 
一 步 派生 得 到 的 ”, AWA o> y. 

一 般 地 , $F oye (USD, UR sm y, REA o HAS, 经 有 


限 步 派 生 后 得 到 y, 则 说 9 是 从 = 派生 得 到 的 , RI IA 
由 此 可 见 ， 语 法 规则 即 是 对 符号 串 进行 重 写 的 规则 ， 规 则 
a> B RATH} = 一 oaaaa HiP a BERE. RRR E 
过 程 一 直 进 行 到 在 一 个 符号 囊 中 没有 变量 出 现 为 止 ， 这 样 得 到 的 
完全 由 终结 符 组 成 的 符号 唐 , 即 是 由 该 生成 语法 生成 的 字 ， 
这 样 , 就 可 以 在 形式 上 将 语言 L(G) 写 成 
L/G) = (215,2 fll 2€ S"), 


L(G) ny 2) f18*, 

乔 姆 斯 基 (N. Ohomsky) 从 研究 自然 语言 的 数学 模型 出 发 ， 
提出 了 按 生 成 语法 的 复杂 程度 将 语言 划分 为 四 个 良 次 的 理论 ( 参 
见 [8] (91). 

PERE G-(V, S, P, so) 为 第 型 语法 ， 如 果 它 满足 以 
下 条 件 : 

¢=0, 元 限制 . 

i=l; 在 每 一 个 语法 规则 a 一 Bb, B 的 长 度 不 短 于 a 的 长 
度 ， 唯 一 允许 的 例外 是 可 以 有 规则 so~>s， 但 这 时 so 不 可 以 出 现 
在 任何 语法 规则 的 右 方 . 

4-2, 每 一 个 语法 规则 的 形式 为 4->B， 其 中 4E 玉 ,8E 
(Vus). 

二 3, 每 一 个 语法 规则 的 形式 为 A— 83 34 A8, 其 中 
A BEV, BES", 

2! 


显然 ,第 3 型 话 法 即 是 8 工 .6 中 的 右 线性 语法 . | 

今后 , 我 们 称 由 第 % 型 语法 生成 的 形式 语言 为 第 * 型 语言 , 并 
将 第 5 型 语言 全 体 所 成 的 语言 类 记 为 ,和 人 队 0 到 3 

以 上 方法 划分 的 语言 层次 称 为 乔 妈 斯 基层 次 (Qhomsky 
Hierarchy), 它 在 形式 诺言 理论 中 起 着 主导 作用 (参见 [1] ~[6]). 

已 经 知道 ， 以 上 四 个 层次 的 语言 类 和 上 两 节 用 各 种 自动 机 定 
义 的 语言 类 存在 如 下 关系 : 

S^ S (RE), 即 递归 可 枚 举 语言 类 . 
:一 2(GS)， 即 上 下 文 有 关 语 言 类 . 
Z= F (QF)， 即 上 下 文 无 关 语言 类 . 
L= F (RG), 即 正规 语言 类 . 
因此 也 有 包含 关系 
CAKARA 

从 $ 2.5 知道 ， 存 在 不 是 第 0 型 的 语言 .实际 上 , 每 个 凶 ， 
G J 0 3] 9) J& up 2448, 而 形式 语言 全 体 为 不 可 列 集 . 

此 外 , 在 ^o 中 有 一 个 由 递归 语言 组 成 的 真子 类 ， 它 包含 Z 
作为 自己 的 真子 类 目前 还 不 清楚 递归 语言 的 语法 特征 是 什 A. 
在 S^ 中 则 有 一 个 由 确定 性 上 下 文 无 关 语言 组 成 的 真子 类 ， 它 包 
& .Zs 作为 自己 的 真子 类 . 

§3.2 上 下 文 无 关 语 言 的 例子 

现在 考察 L= LOF) PALARAT. 

[81] L-1(010'421), 81.7 p ARSAC È 
不 是 正规 语言 。 现在 我 们 来 证 明 这 个 工 是 上 下 文 无 关 语 言 ， 为 
此 , 只 要 构造 出 一 个 第 2 型 语法 G, 使 L= LG), 

^G-(,8, P, s), Kip V={%} 8 ={0, 1, P— (s 
010, s,— 0so0}， 用 数学 归纳 法 容易 证 明 工 = 工 (G). 

以 后 也 称 第 2 苞 语 法 为 “上 下 文 无 关 语法 ”. 

为 方便 起 见 ， 在 列举 语法 规 刚 时 可 将 a 一 Bi 和 ww 一 Bs 合 写 
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为 a-> Bll 8:， 对 于 多 于 两 个 规则 的 合 写 记 法 是 类 似 的 . 

[pi 2]. 在 算术 表达 式 中 , 括号 的 使 用 、 配对 和 取消 可 以 所 一 
个 上 下 文 无 关 语 言 来 描述 ， 即 所 谓 狄 克 语 言 (Dyck Language). 

取 终 结 符 集 

BS (e, **, Ony Oxy en 
BR V = {s0}, 语法 规则 和 集 
P = (so 8 | S080 | 04806; | *- le,5.6. 

就 得 到 G-(V,S, P, s) MKB L-L(G)CcS*, 

工 中 字 的 特征 是 有 限 次 应 用 ee4~>?8 之 后 会 变 成 a( 其 中 5 
—Í, 2, +, 1%) ,这 里 不 允许 将 ete 变 为 8, WB, HE e M o, 
是 对 于 算术 表达 式 中 左 括号 和 右 括 号 的 模拟 ， 取 5 从 工 到 nn 则 代 
下 有 nn 种 不 同类 型 的 括号 混合 使 用 . 

例如 , 在 4 一 工时 ， 将 er Mel ERACO ZR, WFA 
号 种 即 是 这 时 的 狄 克 语 言 中 的 一 个 字 ; 

(€ OCC DC DICE DU XC 2». 


§33 上 下 文 无 关 话 言 的 泵 引 理 


与 $1,7 相仿 , 上下文 无 关 语 言 也 有 相应 的 泵 引 理 (Pumping 
Lemma), 所 起 的 作用 也 是 类 似 的 . 

引 理 如果 工 是 一 个 上 下 文 元 关 语 言 , 则 存在 一 个 只 与 二 有 
KNBR n CAA THEM: ME SEL, H |r| >n, 存在 “的 一 
Ay Sy He =uoway, lusi, lewsl«n Hé 
arv'watye L 成 立 ， 

其 证 明 可 参看 文献 { 茹 、[21、[64、[6J 中 的 任何 一 种 ， 这 里 只 
限于 举例 说 明 它 的 用 法 . 

[583] L-í0']620) 

ES 1.7 CAEH LEFRERE. 现在 我 们 来 证 明 工 也 
不 是 上 下 文 无 关 语言 . 
用 反 证 法 ， 设 工 蚌 上 下 文 无 关 语 言 ， 则 按 引 再， 存在 满足 引 
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理 中 所 述 条 件 的 整数 %， 任 取 一 个 2EI, [z| >, 则 有 分 解 式 : 
— ucwory, fii |ve| >L vws] en, Beg $20 有 wviwv'y€ L, 
3k 3e 9E HE [214+ (6— 0 los | 的 所 有 0 EARS O £I, 
的 串 ) 都 是 工 中 的 字 . 但 这 与 荆 中 的 所 有 字 的 长 度 为 等 比 数 列 
(2,2. TH Ji. 

[8] 4] L= {rbl tel RE EP MAKE. 

仍 用 反 证 法 ， 设 了 工 是 上 上下文 无 关 语 言 ， 则 存在 引 理 中 所 说 的 
Hen, Ke=o''c’, WEARER Z—uwory, |vz|z91,. [vor] < 
n, ARE $220 dg uvlwe'yEL, | own] «m nj B, own 不 可 能 
同时 含有 三 种 符号 abo, 因此, 在 way 一 六 中 三 种 符号 个 数 
不 相等 , 引出 矛盾 ， 


$3.4 fA #2] æ (Ogden Lemma) 


泵 引 理 是 一 个 语言 为 上 下 文 无 关 语 言 的 必要 和 条件， 并 不 是 充 
分 条 件 、 本 书 中 还 需要 更 为 有 力 竟 奥 登 引 理 . 它 虽 然 也 是 以 必要 
条 和 件 的 形式 出 现 的 , 但 不 易 找到 一 个 例子 证 明 它 不 是 充分 条 忻 . 其 
证 明 可 看 原文 [11]. 

奥 登 引 理 ”如果 工 是 上 下 文 无 关 语言 , 出 存在 一 个 只 与 二 有 
KARR n, 它 具 有 下 列 性 质 : 对 任何 2zEL，jzj z2n, 并 且 用 任意 
方式 将 符号 串 s 中 不 少 于 % 个 符号 的 位 置 选 为 特定 的 可 区 分 位 
M, 存在 z 的 一 个 分 解 z 二 wvwny, 满足 以 下 条 件 ; 

1* 或 者 & 和 ?都 含有 可 区 分 位 置 ,或 者 和 2 都 含有 可 区 分 
位 置 . 

2° wwe BES n 个 可 区 分 位 置 ， 

3” 急 至 少 合 一 个 可 区 分 位 置 . 

4? MEP 92:0 p yr. Wovty CL, 

从 这 个 引 理 可 以 直接 看 出 ， 如 果 将 符号 串 “的 每 今 符号 的 位 

轰 都 选 为 可 区 分 位 置 , 则 就 得 到 $ 3.3 中 的 泵 引 理 , 
现在 举 一 个 例子 。. 
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[A5] Le-fabo!i-057j-E-l). 

用 系 引 理 不 能 证 明 工 不 是 上 下 文 无 关 语 言 . 实际 上 , 对 于 
za bcd CL, ig ¢=0, UN 4, &, 0 ERR ml, 30 670, 由 在 分 解 式 ? 
=uvway 中 的 vus TRER o 中 , 因此 不 能 引出 矛盾 . 

现在 用 奥 登 引 理 . 设 工 是 上 下 文 无 关 语 言 ， 则 存在 引 理 中 记 
说 的 整数 %， 取 >>0 和 

z- ght igrtigsti c L, 
JF EET m o? 所 在 的 ”十 1 个 位 置 选 为 可 区 分 位 置 ， 这 时 , 如 果 
有 分 解 式 z= uvwy, WAT S IER fp 2°, own 就 不 能 覆盖 oT, 从 
而 不 可 能 同时 含有 符号 5 和 8， 因 此 , 440 BJ, XE uvtosz'y 中 符 
号 53 和 2& 的 个 数 不 会 相等 ， 这 与 有 >0 fl uv'was'y C L AF IA. 


§3.5 X T 之 a 和 $s 的 两 个 定理 


在 什么 情况 下 一 个 上 下 文 无 关 语 言 也 是 正规 语言 ?这 方面 , 我 
们 介绍 两 个 结果 . 

第 一 个 结果 给 出 了 上 下 文 无 关 语 言 也 是 正规 语言 的 一 个 充分 
必要 条 件 . 

BRG=(V,8, P, se) 为 上 下 文 无 关 语 法 。 如 果 在 派生 过 程 


中 不 出 现 A AB, Hit 4 为 变量 oa 和 B 是 (V US)" HRES 
i, 则 称 G 具有 非 自 媒 变 性 质 . 

观察 8 3.2 中 的 例 1 和 例 2， 从 它们 的 语法 规则 已 可 看 出 ， 其 
中 的 两 个 语法 都 不 具有 非 自 嵌 套 性 质 . 

实际 上 , 这 并 非 偶然 ， 关 于 这 方面 , 有 下 列 结 果 ; 

EBL 一 个 上 下 文 无 关 语 言 工 同时 也 是 正规 语言 的 充分 必 
要 条 件 是 ， 存 在 一 个 具有 非 自 殿 赛 性 质 的 上 下 文 天 关 语法 9， 使 
L-L((G), 

特别 是 , 在 1.6 的 右 线性 语法 就 具有 非 自 嵌 套 性 质 . 

关于 定理 1 的 证 明 , 可 以 看 [2]. 
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第 二 个 嫩 果 是 符号 集 S 只 会 一 个 符号 时 的 有 关 事实 : 对 于 只 
出 一 个 符号 生成 的 形式 语言 , 如 果 是 上 下 文 无 关 语 言 , 则 一 定 也 是 
正规 语言 . 为 了 较 完 整地 叙述 这 个 结果 , 先 介绍 以 下 概念 . 

整数 集 tot pst 0} MRE, Sep ey Aes. 如 
p=, BI (c). 有 限 个 线性 集 的 并 称 为 半 线 性 集 . 

定理 2 如 有 果 工 是 只 由 一 个 符号 生成 的 形式 语言 。 则 以 下 三 
个 条 人 性 等 价 ; 

1° 工 为 正规 语言 . 

3 了 为 上 下 文 无 关 语 言 . 

3° 工 中 字 的 长 度 记 成 的 整数 全 是 一 个 半 线 性 集 。 

关于 定理 2 的 证 明 , 可 参看 [i] C10]. 


$3.6 上 下 文 有 关 语 言 


§ 3.1 给 出 了 上 下 文 有 关 语 言 的 生成 语法 定义 ， 但 是 , BE 
有 另 一 个 等 价 的 生成 语法 定义 . 

这 里 ， 在 生成 语法 各 = (了 ,8 P, so 的 生成 规则 集 Pop, 我 
们 要 求 每 个 规则 的 形式 为 

yÅ —> a Bota, 

其 中 a, aa, BE (VUS)*, ACV, B 了 8， 这 里 唯一 允许 的 可 能 饮 
外 是 Some, 同时, 如 果 卫 中 有 这 个 规则 ， 则 so 不 能 出 现在 任何 
规则 的 右 方 . 

可 以 证 明 , 按照 这 个 定义 得 到 的 语言 类 即 是 COS). 
我 们 称 A. 中 的 语言 为 上 下 文 有 关 语 言 的 原因 ， 即 是 从 这 第 二 个 
定义 来 的 ， 实 际 上 上 ， 在 第 二 个 定义 中 ， 变 量 ARAL aAa 的 情 
党 下 才 可 以 将 4 改写 为 后 而 得 到 abas, 也 就 是 说 , 4-8 MER 
“上 上 下文" 为 u 和 oz 时 才能 使 用 . 

对 于 一 个 上 下 文 有 关 语 言 ， 要 写 出 相应 的 生成 语法 往往 不 是 
一 件 容 易 前 事 ， 下 面 举 两 个 例子 ， 其 中 的 语法 仍 使 用 83.1 中 关 
于 第 工 型 语法 的 定义 。 当然 ， 我 们 也 称 第 1 型 语法 为 上 下 文 有 关 

26 


- 


[ 例 6] L={0" ¢>0} 2 E FOCH RMA. 
例 3 已 经 证 明 这 个 工 不 是 上 下 文 无 关 语 言 ， 现 在 我 位 写 出 
一 个 上 下 文 有 关 语 法 G9, 并 证 明 L= Le), 
令 语法 
G= (£s, O, D, E, F, L, R}, {0}, P, so, 
其 中 卫 给 定 如 下 : 
P - (s, 0102|0*| DLOE, DL-» DOR|O^F, 
RO+OOR, RE— LOOE, OL— LO, 
FO —0?F, FE 0*}, 
由 于 其 中 每 条 规则 都 满足 8$ 3.1 中 关于 第 1 型 语法 的 要 求 ， 
因此 I(G) 是 上 下 文 有 关 诸 言 ， 下 面 只 要 证 明 L-L(G), 
在 工 中 的 字 0.0 30 0* h so 直接 生成 ， 一 般 地 则 有 
so > DLO™E, 
其 中 a~l, RÁITESERUR IL Co RME, MA DLO™E 出 发 , 分 
两 种 情况 讨论 . 
如 果 不 使 用 DL OF, 则 有 
DLO"E-» DORO*E > DOrzmBR 卫 


— DOLO E => DLO, 
Fy L apy m 2an t8, NAMA do BSR es. 的 通 式 为 
d,—2"?—8 
从 DLOSE 出 发 的 另 一 种 派生 是 使 用 规则 DL-+ OF, 这 时 
有 
so > DLOWE > 0*FO«E 


0t FE => Q20n* 8 — or" à 
这 对 %=0, 1, Me, 这样 ， 我 们 已 证 明了 LOL), Weir 
WHE LG PURA O X RODA Bg (20, RIELL-LO)CGS 
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W [1]. (61). 

(8]7]1 L-ío'be $21), 

从 83.3 中 的 例 44 已 经 知道 工 不 是 上 下 文 无 关 语 言 ， 现 在 令 
G=(V, 8, P, s), HPV ={s, X, Y}, 5S = {6, b, cb, HRM 
DE 

P-íso—abe|aX be, X b—b X, Xo—Y bec, 
bY —>Y b, aY > aoX jaa], 
按照 $ 3.1 中 关于 G1(—-LF (CS) MEX, TRLG) 是 上 下 文 有 
XA. MEW L-L(G), 
从 so 出 发 ， 除 了 直接 生成 abeC LZ, MET tS 1 TWA 
uva H 
So => o! X b'e, 
为 了 证 明 这 一 点 ， 可 以 对 + 用 数学 娄 纳 法 . $—1 RERAN RP 
中 的 一 条 规则 . 现 设 4 已 成 立 , 则 有 
sdb 〈 归 纳 假设 ) 

> GV otto (MB OXb—bX, XoY beo, bY —Yb) 

=> MAX Dag 
这 里 最 后 一 步 派 生 使 用 了 规则 oY aX, RERE TI HAE 
明 . 

KM a! X biet ($221) 出 发 ， 有 

aX be! S Y Het (Ry E) 
=> ghp (用 aY — aa), 
其 中 >11, REBT LEL(G). AEH, ANAL 
=~ L(G), KE AR. 

关于 上 下 文 有 关 语 言 类 (=L (08), RT Æ $ 2.6 提 到 的 
线性 有 办 自动 机 问题 未 解决 之 外 , 还 有 其 他 一 些 问 题 也 没有 解决 . 
最 近 , 一 个 著名 问题 ， 即 (QS) 关于 补 运算 是 否 封 闲 已 得 到 肯 尖 
VERAS AR. 

28 


$4 并 行 重 号 系统 


前 见 节 主要 介绍 了 乔 姆 斯 基 的 层次 理论 .这 个 理论 在 自然 语 
言 和 计算 机 语言 的 研究 中 都 是 非常 重要 的 ， 但 它 并 不 是 在 形式 语 
言 的 复杂 性 研究 中 唯一 可 用 的 理论 在 动力 系统 的 语言 复杂 性 研 
究 中 , 我 们 还 需要 另 一 类 很 不 一 样 的 语言 理论 , 即 本 节 要 介绍 的 L 
RR, 它 是 由 生物 学 家 林 登 梅 耶 ( 和 . Lindenmayer) 建 立 的 形式 
语言 系统 ， 本 节 材 料 的 主要 来 源 为 [12] — [15], 


$4.1 最 向 单 的 荆 系 统 


Il Bi, KA AE RR EG = (V, S, P, so), np RAT Bal 
L(G) PASS, 要 从 初始 符 so 出 发 , 不断 使 用 古 中 的 语法 规则 进行 
重 写 ( 即 改写 ), BAS BERS AV PASE By th. 这 里 的 
重 写 特 征 是 每 次 使 用 一 条 规则 , 即 一 步 派生 (参见 8 3.1), RN 
这 祥 的 重 写 过 程 叫 做 串 行 重 写 ， 

林 登 梅 耶 在 研究 生物 发 言 过 程 的 数学 模型 时 提出 了 与 上 述 串 
行 重 写 完全 不 同 的 并 行 重 写 系统 . 它 的 主要 特征 在 于 , 在 将 一 个 
符号 音 重 写 时 ， 该 符号 串 中 的 每 一 个 符号 都 必须 同时 参与 重 写 过 
E 由 此 建立 起 来 的 形式 语言 系统 称 为 LRA QEF H LE 
林 登 梅 耶 原 姓 的 第 一 个 字母 . 

实际 上 , 工 系 统 包含 了 许多 子 系统 ， 分 别 生 成 各 类 形式 语言 
这 一 小 节 先 介绍 最 简单 的 DOL 系统 , 其 中 D 是 指 确 定性 , O 是 指 
每 一 个 符号 在 重 写 时 与 相 邻 符号 无 关 . 

DOL 系统 是 一 个 三 元 组 

G — (S, h, e), 
其 中 总 为 有 限 符 号 集 , 太 是 从 及" pis S* 的 同 态 映 射 , oE S" 是 初 
始 符号 串 ， 由 各 生成 的 语言 定义 为 
L(G) = {4 (w) ls>0), 
29 


称 为 卫 0 工 iz z. 

关于 同 态 , 在 81T.9 的 (6) 已 经 遇 到 过 ， 一 般 而 言 ， 设 妨 和 4 
是 两 个 符号 集 , an E BR A: S"- A" 满足 条 件 有 (Ce) =e, IF, OS 
中 的 任何 一 对 加 和 3 成立 六 (sy) — h (e) (2, WER A AAS. Hah 
可 见 , 只 要 对 每 个 符号 GCS 规定 了 hale 4, ixi Tz. 

AI 我 们 已 经 知道 ， 工 = {0? 14 芝 中 是 上 下 文 有 关 语言 ， 
但 不 是 上 下 文 逃 关 语 言 和 正规 语言 (参见 $1.7.3 3.3 和 $83.6). 

现在 定义 一 个 DOL 系统 

G= ({0}, 10— 00), 0), 

可 以 直接 看 出 工 = 工 (G)， 

以 后 将 说 明 , DOL 系统 是 工 系统 中 最 简单 的 一 个 子 系统 , 

由 这 个 例子 已 经 可 以 看 到 ， 形 式 语 言 的 复杂 性 并 没有 一 个 绝 

对 的 度量 . 本 例 中 的 语言 工 在 乔 姆 斯 


基层 次 中 为 第 1 漠 语 言 ， 复 杂 性 层次 
[m 相当 高 . 但 它 在 工 系统 中 则 可 以 认为 
是 非常 简单 的 ， 在 下 面 还 会 看 到 相反 
Cal, 的 例子 . 

图 4-1 图 4-1 WB] DOL 语言 与 乔 姆 其 
基 语 言 屋 次 的 关系 ， 其 中 用 FIN 代表 有 限 语 言 类 , 即 只 含有 限 个 
符号 串 的 语言 全 体 ， 因 此 从 生成 语言 的 能 力 来 说 , 可 以 看 到 , 工 系 

统 的 理论 也 有 自身 的 问题 . 


§4.2 OL, TOL f ETOL 条 统 


首先 要 去 掉 DOL 系统 中 的 确定 性 特征 ， 为 此 , 我 们 引入 一 
BERK KREAS. 
$1.9 已 经 提 到 过 置换 的 概念 ， 现 在 作 较 为 一 般 性 的 叙述 . 设 
S 和 本 是 两 个 有 限 符 号 集 . 对 每 个 sE8, Ro@MRRE 4 上 的 
一 个 语言 , 即 o(e)t a" BER cte) — 5, 并 且 , 对 在 S" 中 的 任何 两 
4 Hi ws 和 we, WSL o(wiwa) — e(wi)o(Qus). XXE, 就 可 以 对 于 在 
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S 上 的 语言 工 定义 
o(L) ={u| tH wEL A ucoQo). 

我 们 称 工 为 置换 . 

WENT OES, oa) WARS CME 4 上 的 有 限 语 言 ), 则 
称 为 有 限 置换 如果 对 每 个 6E8，c(GJ) 只 含 一 个 符号 串 ， 则 oe 
就 是 $4.1 中 介绍 的 同 态 .特别 ， 当 每 个 ola)&€ 4 时， 称 c 为 编 
a. 

现在 介绍 OL 系统 , 它 是 一 个 三 元 组 

G= (8, a, «), 
其 中 的 8 fio Mx x DOL 系统 相同 , 所 不 同 的 是 , RBA o JE 
AREK, 比 同 态 更 为 广泛 ， 由 OL AEG AEGRIS GS 
L(G) = Loa), | 

称 为 OL 语言 ， 

[52] 我 们 知道 工 = {tD"|”>>0} 是 正规 语言 . EW ERE 
达 式 即 是 9， 可 以 证 明 ， 这 个 工 不 是 DOL 语言 ， 即 不 能 用 任何 
DOL 系统 生成 . 但 只 要 了 到 

G= (10), {0->8, 0-00}, 0), 

31183] L2 L(GO, 因此 工 是 OL 语言 . 

但 是 , 这 样 的 OL 系统 在 生成 语言 方面 的 能 力 仍 不 很 强 . 为 
此 , 我 们 再 介绍 TOL RE. 

TOL 系统 也 是 一 个 三 元 组 

G-—(8, H, o), 
黄 中 的 S flo itd i, H 则 是 由 有 限 个 有 限 置 换 组 成 的 非 空 
集 ， 这 就 是 说 , 五 的 每 一 个 元 是 一 个 有 限 图 换 ， 对 每 个 hE€ 五 ,三 
TAS, h, oo) 是 一 个 OL 系统 ， 称 为 G 的 一 个 分 系统 . AGA 
BS B ERA 
L(G) = {rE S*|z—o X cE hih hon), 
其 中 Ag, hat, hE LC}, 
3I 


«LGD TOL 语言 . 

[p3] Bw L-ieb6]920) RELI RAKBA, 但 不 是 上 
下 文 无 关 语 言 ， 当 然 更 不 是 正规 语言 (参见 83.8 与 $3.6). 

MES G-(8, H, o), 其 中 

S —1e, b, ch}, 
c -— «bo, 
H = {ħa hes}, 
hi= {a —> aa, b— bb, 0—> cc}, 
ha= {0 —> e, b— 8, 0-> 2], 
容易 验证 工 ~ 工 (9). 因 此, 这 个 工 蚌 一 个 TOL 语言. 

但 是 , 用 TOL 系统 还 不 能 生成 所 有 的 有 限 语 言 . 因此 ， 从 这 
个 角度 来 看 , TOL 系统 生成 语言 的 能 力 还 不 够 强 .， 这 一 点 可 从 下 
而 药 例 子 得 到 了 解 ， 

[ 例 4] 工 = {6, 4 } 不 是 TOL 语言 ， 当 然 也 不 是 OL 语言 
DOL 语言 . 

用 反 证 法 ， 假设 有 一 个 TOL RAG=(8, H, o) W 
L(G) ={e, @}, 2H, Æ a dl a? 中 总 有 一 个 是 初始 串 o. 

MRe-w, WACHRAARKHTHESE 得 到 ahy yA 
ae, (Hia neh ERE =a’, 这 里 利用 了 应 用 重 写 
规则 时 与 相信 符号 无 关 的 特征 .这 与 工 中 只 会 两 个 字 矛 盾 ， 

MR =o, ae >a RA ose flaso 成立 ， 但 这 样 
ERZA =a? 成 立 , 与 ELF. 

于 是 ， 我 们 看 到 ， 一 方面 用 最 简单 的 DOL 系统 , 已 经 可 以 生 
DEED RUE TJ ue LP RAKE AWA, 
以 上 介绍 的 三 种 工 系统 还 不 能 生成 所 有 的 有 限 语言 ， 而 在 乔 姆 斯 
基层 次 中 有 限 语 言 是 作为 最 简单 的 正规 语言 来 看 待 的 . 

E TOL 系统 的 基础 上 ， 将 生成 语法 系统 中 区 分 变量 和 终结 
符 的 做 法 借用 过 来 ， 人 情况 就 会 改观 ， 这 就 是 下 面 要 介绍 的 ETOL 
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ETOL 系统 是 一 个 四 元 组 
G=(V, H, œ, 8), 
HUG) = (V, H, @) 是 一 个 了 OL 系统 ， 称 为 G 的 基础 系统 ， 
SEV Jk 人 的 终结 符号 集 ， 由 邓 生 成 的 语言 定义 为 
L(G) -L(U(G))n8*, 

换 名 话说， 在 符号 集 PRE SARTRE, 而 不 
人 允许 在 语言 L(G) 的 字 中 出 现 ， 我 们 称 LCG) 为 ETOL 语言 . 

完全 相仿 地 , 可 以 从 OL 系统 出 发 定义 EOL 系统 以 及 相应 的 
EOL HE. 

在 工 系统 中 ， 还 有 其 他 许多 子 系统 ， 它 们 在 生物 学 中 都 有 特 
ENE, 这 里 不 再 一 一 介绍 . 

由 于 工 系 统 具 有 并 行 重 写 的 特征 ， 近 年 来 它 在 分 形 儿 何 、 植 
物 生长 模拟 和 计算 机 图 形 学 方面 得 到 应 用 。 对 于 这 方面 , 可 参看 
[14]. [15]. | 


$4.8 语言 类 之 间 的 关系 


在 工 系 统 中 , 除了 各 种 OL( 子 ) 系 统 之 外 , 还 有 各 种 IL 系统 ， 
EIL 系统 中 的 并 行 重 写 过 程 要 将 相 邻 符号 的 作用 考虑 进去 ， 与 
8 3 相仿 地 , 我 们 可 以 称 OL RAN EFIE LRA”, m 
世系 统称 为 * 上 下 文 有 关 的 工 系 统 ”， 与 REL EIL 
ETOL 系统 的 定义 方式 相仿 ， 可 以 定义 JIDL — og 
系统 以 及 相应 的 BIL 语言 . 

图 和 -2 列 出 了 以 上 介绍 的 几 种 工 系 统 
语言 与 乔 姆 斯 基层 次 之 间 的 关系 ， 其 中 , 每 
个 小 圆 点 代表 -- 个 语言 类 . 记号 REL OSL, 
OFL 和 RGL 代表 乔 姆 斯 基 的 四 个 层次 ， 从 <2 
一 个 小 圆 点 到 另 一 个 小 圆 点 之 间 , 如 有 有 向 线段 , 则 表示 较 低 的 小 
圆 点 所 代表 的 语言 类 为 较 高 的 小 圆 点 所 代表 的 语言 类 亡 真 包含 . 
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以 后 , 用 .ZCDOD) 表 示 DOL 语言 全 体 所 成 的 语言 类 .， 对 于 
3t Lo rnb dngk PH 4-2 A (DOL) fl -Z (OL) E 
SJ (CS) i X726, 但 与 YCRG) 或 如 (QF) 则 不 存在 包含 关系 ( 参 
RE 4-1)， 对 今后 有 用 的 包含 关系 是 

LCF) GZ (EOL) G-Z (ETOL) g -Z (OS). 

请 注意 , 在 荆 系统 中 最 大 的 语言 类 S (SIL) 5j FA E 次 

中 第 0 型 语言 类 .和 (RE) 相 同 ， 这 是 很 有 意义 的 事实 . 


84.4 关于 卫 TOL 的 一 些 性 质 


ETOL 系统 是 在 上 下 文 无 关 的 工 系统 中 最 大 的 一 个 子 系 统 ， 
它 在 工 系 统 理论 中 占有 重要 地 位 (参见 [13]). 

已 经 知道 , 语言 类 名 (DOD) 和 禾 (0L) 对 许多 简单 运算 都 不 
封闭 . 与 此 不 同 的 是 , 语言 类 a iia p tE 
质 , 这 在 动力 系统 药 应 用 中 是 重要 前 . 

具体 来 说 , LETOL) 对 于 以 下 六 种 运算 都 是 封闭 的 , 三 种 正 
规 运算 ( 即 取 和 . 连接 和 闭 包 ). AS. 逆 同 态 以 及 与 正规 语言 取 交 
(2w $1.9), 

在 形式 语言 理论 中 ， 对 以 上 六 种 运算 封闭 的 语言 类 称 为 完全 
AFL # (Full Abstract Formal Languages), 已 经 知道 ， 
ZRG), (OF), L (RED M.Z (ETOL MES AFL, 但 
Æ, LCS) AR RRS APL, 

RAM E, LOL) 对 上 述 六 种 运算 的 每 一 种 都 不 封闭 ， 
学 (EOL) 则 对 其 中 的 同 态 和 逆 同 态 不 封闭 . 

”可 以 证 明 , 存在 一 个 单调 增长 的 语言 类 序列 {2j,>o 其 中 每 
一 个 Vesta APL 类 ,使 成 立 
(ETOT) = fee Vig GV sente T (O8), 
UEEGXH BEI S. ERIBNIEE Uia X. 
作为 一 个 例子 , 我 们 来 证 明 图 4-3 中 的 
OF) 条 .ZEOL) 
34 


这 同时 也 建立 了 SZ (OF)S Z(ETOL), 

M 84.1 Hl BA IZ (OF) AZ (EOL), UPFARBIERS 
关系 成 立 . 

ELC.Z(OF) RREN 存在 一 个 第 2 型 语法 G=, S, 
P, s), 使 工 一 工 (G). 

现 定义 一 个 OL 系统 

G’=(VUS, PU(a-»alac€V US], so). 
容易 验证 
L=L(@) Ns", 

实际 上 ,从 好 的 构造 可 见 在 G 中 的 每 一 步 派生 可 看 成 为 在 好 ' 中 
的 并 行 重 写 ， 证 毕 . 
84.0 标号 语言 

作为 上 下文 无 关 语 言 的 推广 ， 又 具有 并 行 重 写 特征 前 另 一 类 
语言 是 标号 语言 (Indexed Languageg)， 它 在 动力 系统 中 也 有 应 
用 .关于 标号 语言 ， 可 以 阅读 阿 堆 (A. V. Aho) MARX Flt 
只 介绍 其 定义 ,并举 一 个 例子 . 

标号 语言 的 语法 是 第 2 型 语法 的 一 种 扩充 ， 它 是 一 个 五 元 组 

G-(Y, S, I, P, se), 

与 $3.1 相 比 , 多 了 一 个 标号 集 工 A BEV HEM, a€ (VU 
S) A tpi, fEI 为 标号 , WEP 中 的 语法 规则 有 三 种 类 型 ， 

1° Aa, 

2° A— Bf, 

8? Af-a, 
由 此 可 见 , 标号 或 标号 串 可 以 在 变量 后 面 出 现 , 但 不 能 接 在 终结 符 
mu. WO 派生 过 程 中 的 每 个 表达 式 都 是 (VU SY)* 中 的 
TIS t. 

ik 8.YC(VP'US»', SEI", X.EV US, i=l, 2, --, k, W 
在 标号 语言 中 的 三 类 语法 规则 的 使 用 方式 如 下 ; 
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1? 对 于 Ae, aoe Xie Xn WA 
BASY => BX 01X ðo X 8,7, 
Mop, xi X,E7 Hacs, xi XES 时 6;=8， 这 就 是 将 标 导 串 
5 并 行 地 分 配 到 a 中 的 每 一 个 变量 后 面 去 . 
2? 对 于 A— Df, 简单 地 有 
BASY => BBFSY, 
8? XT Af-a-Xi1Xr»-XyBH 
BAfoY-— BX 81X 05 X 0,7, 
其 中 关于 5 的 规定 与 1? 中 相同 . 
可 将 以 上 和 看 成 为 标号 ( 操 ) 的 分 配 、 增 加 和 使 用 (或 消耗 )、 在 
1° RS 中 都 具有 并 行 重 写 的 特征 . 
定义 语言 
L(G) = {w] so Sw H wES*} 
为 对 生成 的 标号 语言 
[ 例 5] L= {abc il gs diu TS 84.2 例 8 对 比 )， 
令 
G=({s, A, B, O, T), 1a, b, c], (f, gt, P, so), 
其 中 有 两 个 标号 了 和 g, 语法 规则 为 
P-i[s—Tg,T-—Tf, T-— ABO, 
Af— aA, Bf—bB, of—> c0, 
Ag-— 2a, Bg— b, Og-—c], 
容易 验证 以 下 派生 过 程 ; 
$92 Trjg 
=> Aft tg Bf 1gO f Ig = abe, 
其 中 ial LAPEER L= LG), 
记 标 号 语言 类 为 SZ ND), 
从 定义 与 例 5 已 经 得 到 
C (OF) &. Z (IND). 
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xe [16] EWA T 
LUND) E-Z (08), 
语言 类 (IND) BA RETI SES TE, 它 是 一 个 完全 AFL R, 
ELIT |f d B 
-Z (ETOL) S-Z (IND), 
因此 , 其 他 OL 系统 生成 的 语言 类 也 都 是 ZND) 的 真子 类 ， 
由 上 可 知 , -多 LIND) 在 图 4-2 中 的 位 置 ， 恰好 在 代表 7 (O08) 
的 圆 点 和 代表 (ETOL) 的 圆 点 之 问 的 直线 段 上 。 


区 间 映 射 与 形式 语言 


本 章 以 单 峰 映射 1 为 例 , 讨论 在 区 间 了 映射 动力 系统 中 自然 产生 
的 彤 式 语言 .在 85 介 绍 符 号 动力 学 扩 的 基本 概念 ， 也 此 为 基 
Wü FES 6 中 给 出 形式 语言 的 定义 我 们 将 从 儿 种 不 同 的 角度 来 
pol 这 里 的 主要 结果 是 ， 这 样 定义 的 形 
式 语言 恰好 反 喘 了 动力 系统 在 任意 有 限时 间 内 的 符号 动力 学 行 
为 . 芭 应 定理 ( 即 $6 定 再 1) 的 证 明 放 在 附录 A 中 .此 外 , 还 证 明 
了 在 形式 语言 中 出 现 的 周期 符号 序列 必定 是 动力 系统 中 某 个 真实 
l3 ERRI pz i 

ACE IG VE ER HE ES 


S8 区 间 映 射 的 符号 动力 学 


本 节 般 述 符号 动力 学 方面 的 基本 概念 ， 为 引进 形式 语言 作 准 
备 ， 共 中 有 关 结 论 大 多 数 不 作 证 明 . 请 读者 参看 所 列举 的 参考 文 


WA. 


IRMETITT 
wf PERM I=(0, 和 上 有 定义 并 映 入 到 了 的 喘 射 ， 如果 
Hy ALU P ak A: 
1° 了 连续 ; 
2^ SEEEN I SIE Pak c RESTE RR Fe)， 在 fo, o) 


t BEAAM EAB A RA OA DO IG BITTE 8685 TS 5 i8» — 35. 
ty EU ATS bP HT S 227920 —445, 
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上 更 格 单调 增加 ,在 (0, 如 上 严格 单调 碱 少 ; 
8* f(0) - f(D - 6, 


d HERR AP, EIE ARE e e aR kA GR n 
4 B dE i d XE thst (Logistic Maps), 这 是 一 族 带 市 参数 的 单 
BER Ste 

fie) -b5s(1—2), 

其 中 0<w<1, 参数 8 HERA O<b<4, AER I=(0, 1], oe 
0, 了 就 满足 上 述 三 个 条 件 ， 在 文献 中 出 现 的 二 次 方 映射 还 有 1 一 
an, a—a? 等 等 形式 容易 证 明 , 在 一 定 多 意义 下 它们 都 是 等 价 
的 . 

作为 函数 来 考虑 ， 单 峰 映 射 中 的 了 并 不 复杂 .， 特别 是 二 次 方 
映射 中 的 f, 就 是 中 学 里 己 熟知 的 一 元 二 次 函数 ， EL E Z5— 
KER (EAA AKU, 单 蜂 映射 则 表现 出 极其 丰 竖 各 
复杂 的 性 态 , 许多 重要 问题 只 是 在 不 久 前 才刚 解决 , RASS MA 
解决 .现在 讨论 更 为 一 艇 的 区 间 映 射 。 从 喘 射 生成 动力 系统 的 沪 
要 过 程 是 和 迭代， 从 区 闽 工 的 某 个 点 二 出 发 ,用 了 不 断 作 运 代 , 得 到 
序列 e, f), KIE) e. RARS fi =f(f@)), 一 般 地 
w faf fe), nz, 就 可 以 将 这 个 序列 记 为 UP" GO uoo. 
其 中 约定 f°(z) 一 25， 我 们 又 可 以 将 它 记 为 

fla) = (a, fie; Fæ), w fæ), e), 

BAERE S FRR o UL ARIS CB). 这 样 ， IA 
个 跌 射 了 生成 一 个 动力 系统 .我们 可 将 迭代 次 数 m 弄 解 为 离散 化 
了 的 时 间 的 第 %% 个 时 刻 ， 于 是 e OH So) MR Re AIA 
源 演 化 的 记录 . 

问题 的 复杂 性 在 于 , 即使 对 于 做工 次 方 上 映射 这 拌 简单 的 情况 ， 
除了 个别 参 数值 之 外 ， 我 们 也 不 能 建立 轨道 f (Om. 
为 了 知道 %% 充分 大 时 轨道 了 (2) 的 动力 学 行为 ， 必 须 寻 求 新 的 方 
ik. 
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TO 年 代 以 来 , SEF RAE RBS OEE AT Hy EE AY BE 
展 ， 诸 如 混沌 .奇怪 吸引 子 等 重要 的 动力 系统 概念 的 形成 和 发 展 ， 
都 与 区 间 迭 代 映 射 的 研究 有 密切 关系 ， 以 下 列举 作者 所 见 到 的 部 
分 文献 , 供 读者 参考 . 

李 天 岩 (Li. T. 了 .) 和 约克 (J. A. Yorke) ARK REIR ROI 
论文 入 8] 中 ,第 一 次 在 科学 意义 上 使 用 了 泥 沌 (Qhaos) 这 个 名 词 ， 
虽然 其 中 的 一 部 分 结果 只 是 沙 可 夫 斯 基 (A. N. Sharkovskii) 的 
工作 19] 的 特例 ， 梅 (BR. M. May) 的 综述 [20] 对 于 区 间 迭 代 映 射 
的 研究 起 了 重要 的 推动 作用 , 其 中 也 对 早期 的 研究 作 了 介绍 。 OK 
RBI. Milnor) 和 萨 斯 顿 (W . Thurstion) 的 长 篇 文 章 [31] 是 在 
区 间 迭 代 映 射 方面 的 基本 文献 , 它 以 预 印 本 的 形式 自 1976 年 以 来 
已 广 为 流 传 ， 关于 区 间 和 迭代 映射 的 第 一 本 专著 , 是 库 列 (上 . 
Collet) MRES (J.-P. Eckmann) H [22], 它 将 在 本 书 中 多 次 
被 引用 ， 其 他 部 分 或 全 部 涉及 区 间 选 代 喘 射 的 专著 有 [23] ~ [20] 
等 . 
$5.2. 符号 动力 学 

先 引进 一 些 基本 概念 . 

最 简单 的 轨道 是 不 动 点 ， 即 fechas, 它 的 轨 是 常 值 
序列 ， 其 次 是 周期 轨 ， 即 存在 某 个 自然 数 p， 使 得 f(z2) 一 zw， 这 
时 , HERI n0 ftsfo) 一 (2) 成 立 , 轨 产 (四 ) 是 周期 序列 .我 
们 称 p 为 周期 ， 称 轨 中 的 点 为 周期 点 或 者 周期 加 点 wep 
是 具有 上 述 性 质 的 最 小 自然 数 , 即使 得 z，f(2),，…，f?~1(w) 各 不 
相同 ， 但 成 立 fr?(w) =z， 则 称 p 为 这 个 周期 轨 的 最 小 周期 ， 不 动 
点 可 认为 是 最 小 周期 为 工 的 周期 轨 . 

MAAR 产 (四 的 序列 中 从 某 项 开始 是 周期 2 FEX), BUE du 
产 (@) 为 终极 周期 加 (了 ventaally Periodic Orbii) .相应 地 , 可 以 
定义 终极 周期 轨 的 周期 和 有 最 小 周期 . 当然 ， 可 以 将 周期 轨 看 成 终 
极 周 期 轨 的 特殊 情况 ， 

40 


以 上 是 三 种 最 简单 的 轨 .， 在 区 间 选 代 喘 射 的 动力 系统 研究 中 
的 一 个 重要 成 就 , 在 于 发 现 极为 简单 的 区 间 映 射 , 在 作为 动力 系统 
来 研究 时 , 会 表现 出 极其 复杂 的 动力 学 行为 。 为 了 研究 它们 的 复 
RE, 已 经 发 展 出 许多 新 的 概念 .理论 和 方法 , 例如 符号 动力 学 , 重 
JE ERE, FERRIER, BE Eb oo RAE. 

下 面 介 绍 符 号 动力 学 的 有 关内 容 ， 并 且 以 此 为 基础 开展 对 区 
间 选 代 映 射 的 语言 复杂 性 研究 . 

对 于 单 蜂 映射 ， 我 们 约定 ， 当 点 落 在 [0, o) 中 时 用 符号 0 来 
w WHARE 中 时 用 符号 二 来 记 ， 对 于 临界 点 就 用 6 来 
记 , 不 再 引入 新 的 符号 ， 这样, 就 可 以 将 轨 f"(z) 转 化 为 由 符号 0、 
1 和。 组 成 的 符号 序列 . 注意 这 时 的 符号 0. 工 并 不 代表 数值 ， 改 


用 其 他 符号 也 是 可 以 的 . 
将 以 上 做 法 形式 化 。 先 定义 将 oC [0, 局 转化 为 符号 的 函数 
0, 34 oC [0, e) Bj; 
A(z)-10 S46 时 ; 
1, H wE (e, 1]Rf. 
然后 定义 


ACf* (0) 7 (Ale), ACF (@)), =, ACP'Q), 0), 

我 们 称 这 个 序列 为 “初始 点 2 的 踪迹 (Itinerary) Ji id A (e) 
(7 ACf* GOD), 以 强调 它 对 % 的 直接 依赖 关系 (我 们 也 称 工 Cz) 是 
胃 六 (2) 的 踪迹 ). 

用 Tc) 代替 加 f' (m), 这 就 是 粗 粒 化 的 描述 方法 ， 初 看 起 来 
这 似乎 太 粗糙 , BORAGE AE, 但 从 符号 动力 学 目前 已 取得 的 
丰富 成 果 来 看 ,这 种 方法 是 非常 成 功 的 ， 这 方面 除了 文献 [18]， 
[19], [21] ~[29] 之 外 ， 还 可 以 参看 莫 尔 斯 (M. Morse) 等 较 早期 
的 研究 工作 [30] ~ [84]. 

今后 ， 我 们 将 动力 系统 在 符号 序列 中 反映 出 来 的 动态 行为 称 
为 “符号 动力 学 行为 ”， 它 与 系统 的 真实 轨道 的 动力 学 行为 之 加 的 
关系 将 在 下 面 论 及 . 
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对 于 将 单 几 映射 经 过 迭代 而 生成 的 动力 系统 来 说 ， 非 常 根 本 
的 -个 事实 十: 几乎 所 有 符号 动力 学 行为 邦 是 由 临界 点 “的 踪迹 
I(e)(-—ACG"CG)DE UEBS. Aux Hé 9| ag 3s — SO 
Ede eek ICf(e)), RRR Ay "8g Rp f ny STR 9 Kneading 
Sequence)". 

今后 经 常用 KSCfO RAAB f TRA, ET RERA 
时 , 简 记 为 KS, 
$5.3 符号 序列 之 间 的 序 

为 了 研究 任何 一 点 we Da eee I (oe) SRE KSCP) m 
的 关系 , 我 们 需要 在 符号 序列 之 闻 引 入 “ 序 ”, 即 某 种 大 小 关系 . 

虽然 每 个 踪迹 都 是 由 三 个 符号 0, 1 和 6c 组 成 的 无 限 符 号 序 
列 ， 但 用 这 三 个 符号 任意 组 成 的 序列 不 一 定 是 某 个 点 EI 的 踪 
3k. 实际 上 ， 由 符号 与 临界 点 的 对 应 关系 可 以 看 出 ， 如 果 在 一 
个 踪迹 Te) Eft bible, 那么 在 这 个 符号 ¢ 之 后 只 能 重复 
dep RI KSC Pf). X, 如 果 在 下 昌 ( 力 中 出 现 则 这 显然 说 明 临 界 
点 上 是 一 个 周期 点 e， 从 而 这 时 在 S(P) 3€ 2533 BK t Mo, 
长 咏 (六 本 号 成 为 周期 序列 ， 与 此 相同 的 是 , 如 果 任 何 踪迹 工 o) 中 
出 现 符 号 ce， 也 就 会 无 穷 多 次 出 现 符 号 c( 往 往 只 写 到 第 一 个 o). 

上 人 述 关于 符号 6 出现 的 特征 也 就 成 为 一 个 符号 序列 是 某 个 
点 的 跨 迹 的 必要 条 件 , 当然 , 这 并 不 是 充分 条 件 . 

设 8 是 由 符号 0.1 和 和 0c 组 成 的 一 个 无 限 序 列 , 记 为 

| S= $,$2---S,77, 
并 设 s 已 满足 上 述 关 于 符号 6 出 现时 的 必要 条 件 ， 在 所 有 这 样 
的 无 限 序 列 所 成 的 集合 上 , 定义 一 个 移 位 算 子 er H: 
OfS1So… ) 一 SaS3… 
mois ARR o ERE (we), W s— I(2), 则 容易 直接 验证 有 
a(I(z)) -ICf (22), 
这 一 性 质 也 可 以 记 为 ooI- If, 
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在 上 上 述 序列 之 间接 以 下 方式 引入 序 ( 即 太 小 关系 )， 并 借用 记 
el Le 和 一 KRIADT LAT ORE. 

HEZTERA A ee Py 

0<e<1, 
注意 , 这 并 非 是 关于 数 的 不 等 式 . 

其 次 , 对 于 只 由 符号 0 和 工 组 成 的 右 限 符号 序列 ( 即 符号 串 ， 
EMA BAB RIOT: 在 符号 序列 中 如 符号 工 出 更 奇数 次 , 则 为 奇 
P, HU, Wy es. 

PRUE s= Sise… PM t= tite ERS OL lu oc Ach JF 
列 ， 且 均 满足 关于 出 现 符 号 6 HS Rs Me, MEH 
te te LBA Seto 则 定义 3 一 瞩 BW, MAsHt Wa. Me 
一 1 开始 , 比较 s Mi. MR ath, MEX Si Oen 
(825), —RHEH, BOA =t e 8, bey fossa toa HP n 
1. KAR sees. (=A s 和 去 的 公共 主 部 ， 因 为 8 d 
满足 关于 符号 e 出 更 的 必要 和 条件， 所 以 在 公共 主 部 中 不 会 出 现 生 
Gc GWA EEsua 6, 即 完全 由 符 导 0 部 1 组成， 我 们 
规定 , 当 saves, = 5:65) SR E, 

S<LE(S>t) €9 Saa aa (854577 1,43), 
MU 34 9…'so 2g 3p ERNST, 

sils >t) © Sua T laa (Sna aaa). 
然后 , RARARE Vids EL B X. 

这 样 引 进 的 序 的 合理 人 性 , 可 以 从 王 列 事实 得 到 说 明 , 即 从 e] 

Ia) PRP ER: 

æ yet, oy -» I(z)«I(y). 
关于 这 个 事实 的 证 明和 对 于 序 的 进一步 了 解 ， 可 参见 [22j 或 已 提 
到 的 其 他 文献 . 


§5.4 必要 条 件 和 充分 条 件 
Jus 是 由 0. 工 利 4 组 成 的 无 跟 序 列 ， 并 在 出 现 符号 BT The 
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足 在 835.8 一 开始 所 说 的 条 件 ， 关于 s 是 否 为 某 点 2E 了 的 踪迹 ， 
有 以 下 基本 结论 : 
1? Mi s= F(a) EUH 2€ I 成 立 , 则 对 每 个 4 了 成 立 
o'(s) < KS, 
2° 如果 K8 不 含 符号 o 且 对 每 个 id 成立 
o*(s) «K8, 
MAH eC I, fis I(o), 

这 里 的 条 件 1° 是 s 为 踪迹 的 必要 条 件 ， 而 条 件 2° 则 是 s 为 
踪迹 的 充分 条 件 ， 对 于 KS 中 含有 符号 o 时 的 充分 条 件 , 这 里 不 
再 给 出 ， 下 面 对 此 另 有 说 明 . 

必要 条 性 1° 的 证 明 很 容易 ， 因 为 f(o) 是 单 峰 映射 在 区 间 
I 上 的 最 大 和 值 ,所 以 对 任何 点 xzEI 和 任何 $2>1, BA fosfo) 
RE. AAS OS 末 提 到 的 保 序 性 质 , 就 得 到 

L(f'(@)) <E(f(e)) - KS, 
青 利用 在 引入 移 位 算 子 0 时 所 指出 的 性 质 ooT 一 了 Tof, 上 式 左 方 即 
等 于 of (I(@)) =a'(s), WHE, 
充分 条 件 2? 的 证 明 要 困难 一 些 , 请 参看 [21]、[22]. 
由 干 必 要 条 件 1° 与 充 


1 
la X 分 条 件 2° 并 不 相同 , 自然 会 
[AN [A 提出 问题 : s= 工 人) 的 充分 必 
要 条 件 是 什么 ? 这 不 是 一 个 
c ”1 容易 回答 的 问题 ， 实际 上 ， 
G) di i 5REBUEAEDEI, AAT 
& 5-1 能 作出 包罗 所 有 情况 的 回 
S EA SL PRT PRS LR, CHR A 
都 是 10”, 

观察 图 IORA o Ky RE, 易 见 I(w) 0107, WABA 
的 某 些 原 象 , 网 不 难 找到 以 0107 为 踪迹 前 点， Un PELIS FETU 

eT BAL 
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但 图 5-1(ii) 的 情况 完全 不 同 。 对 任何 自然 数 m 和 不 存在 点 
wET, 使 I(w) 一 0"10” 利用 在 (让 中 w=0 是 在 [0, 0) PME 的 
不 稳定 不 动 点 , 这 一 点 是 容易 证 明 的 . 

现在 检验 s=0"10~(n>0) 与 条 件 1° 和 2° 的 关系 ,从 35.3 中 
的 序 的 定义 容易 看 出 , HEA i>i H o(s) <KS=10", 44-4 d= 
n 时 , 这 里 成 立 等 号 , 因此 条 件 2° 不 满足 . 

从 以 上 讨论 可 见 ， 图 5-10) 说 明了 充分 条 件 2^ 并 非 是 必要 
的 , 5 0^107 (n2- 0) A IE 2 HE 25, 但 仍 存在 = 使 s= 工 z)， 另 一 
Jj Bi, 图 5-1(ii) 则 说 明 必 要 条 件 1° 并 不 是 充分 的 . 

最 后 指出 ， 从 必要 条 件 推出 揉 序列 本 身 必 是 移 位 最 大 宇 ， 邵 
at(KS)<KS xj4g4- 470 成立。 可 以 证 明 这 也 是 成 为 揉 序列 的 
充分 条 件 . 


$ 6 形式 语言 的 定义 


在 符号 动力 学 的 基础 上 , 本 节 给 出 单 峰 映射 的 形式 语言 定义 ， 
并 对 其 合理 性 进行 探讨 ， 可 以 看 出 ,这 种 定义 形式 语言 的 方法 有 
其 必然 性 . 
$6.1 从 万 许字 定义 形式 语言 

首先 ,我 们 不 准备 考虑 含有 符号 “ 的 踪迹 ， 实 际 上 , 从 单 峰 映 
射 的 定义 可 以 看 出 , 任何 一 个 点 的 原 象 不 超过 两 个 ， 因 此 , 临界 点 
c 的 所 有 (有 限 次 ) 原 象 用 数学 语言 来 说 最 多 只 有 可 列 个 ， 从 这 种 
原 象 点 出 发 的 轨 在 未 到 达 临 界 点 之 前 ， 与 邻近 点 的 轨 的 符号 动 
力学 行为 是 相同 的 ， 而 在 到 达 临界 点 。 之 后 的 符号 动 方 学 行为 即 
是 简单 地 重复 揉 序列 KS， 因 此 , 去掉 这 些 原 象 , 对 于 动力 系统 的 
符号 动力 学 行为 并 没有 委 失 什么 ， 这 样 在 下 面 我 们 就 只 研究 仅仅 
由 符号 0 和 工 组 成 的 踪迹 . 

其 次 , 我 们 习 进 允许 字 的 概念 ， 它 只 与 给 定 的 择 序 列 有 关 , 而 
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与 具体 的 映射 无 关 . 

设 已 给 定 一 个 揉 序 列 KS, 我 们 称 由 符号 0 和 1 组 成 的 光 限 
Rls 为 关于 KS 的 一 个 允许 字 , 如 果 对 每 个 =>0 满足 条 忻 

af(s)< KS, 

这 个 定义 与 $5. 生 中 的 必要 条 件 1 只 有 一 点 差别 ， 即 在 4 一 0 
时 要 求 不 等 式 也 成 立 . 容易 看 出 , 任何 点 ce [0，7fKe)], REER 
是 “的 某 次 原 象 , 它 的 踪迹 开 oo) 就 是 符合 上 述 定义 的 多 许字 ， 另 
一 方面 , sE (fo), 1] 时 , MARA LR, 因此 不 是 允许 
F. 然而， 由 于 这 时 必 有 f@)<f(o) mu, BS ICf(2))45 R3 
允许 字 ; 只 要 SORE “的 某 次 原 象 ， 

由 以 上 讨论 可 见 ， 引 进 允 许字 的 概念 相当 于 把 讨论 范围 从 区 
间 工 = [0, 1] 缩 小 到 [0，f(o)] E. 由 于 单 蜂 映射 生成 的 动力 系统 
的 主要 动力 学 行为 总 是 发 生 在 [0，f(C0)] 中 ， 因 此 这 是 可 以 接受 
的 .对 于 由 此 引起 的 形式 语言 定义 上 的 差异 将 在 下 面 讨论 ( 见 
8 6.6), 

ATMA TAB. RiP FRY ERA KBR dE 
D-1 的 讨论 中 已 经 见 到 ), 同时 允许 字 为 无 限 符号 序列 ， 不 能 应 用 
现成 的 形式 语言 工具 来 研究 . 

采取 以 下 做 法 可 以 网 时 和 解决 这 两 个 问题 . 即 只 要 取 所 有 人 允许 
字 的 所 有 有 限 子 串 构成 一 个 形式 语言 。 它 将 具有 下 面 说 明 的 良好 
这 里 要 指出 ， 当 3 为 允许 字 时 ， 对 任何 6-0, o'(s) 也 是 允许 
Y. 因此 从 所 有 人 允许 字 取 所 有 有 了 限 子 串 的 做 法 ， 与 从 所 有 允许 字 
取 所 有 前 缀 (Prefix) 的 做 法 是 完全 等 价 的 (这 里 要 使 用 在 $1.2 
中 介绍 前 一 些 概 念 )， 

现在 引进 正式 的 数学 记号 ， 设 了 为 一 个 单 妖 映 射 ， KB( 了) 为 
揉 序列 ， 定 义 形式 语言 . 

L-it€ (0, 如 "| 存在 允许 字 s, 使 1 为 s 的 前 级 }. 
我 们 称 工 是 “ 单 峰 ,映射 的 形式 语言 也 称 工 是 “由 揉 序列 
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KS( 了 ) 确 定 的 形式 诺言 ”. 

由 允许 字 的 定义 可 见 , T, 实际 上 只 由 揉 序列 确定 , 而 与 具体 的 
RHEA. ARAM IKE HEH ERA KS 上 的 
算 子 多 ,并 记 

L= (KN). 
如 上 所 述 , 算 子 名 的 含义 是 , 从 ES 出 发 确定 所 有 人 允许 字 , 然后 到 
它们 的 所 有 前 缀 . 

我 们 总 是 要 求 eEL， 这 里 8 为 空 囊 。 由 于 s 是 任何 符号 序 
列 的 前 级 , 因此 可 以 认为 sE 工 已 隐 含 在 工 的 定义 之 中 . 

我 们 发现 ， 对 于 语言 卫 来 说 ， 在 讨论 图 5 工时 那样 的 困难 并 
不 存在 ， 这 就 是 下 面 的 一 个 定理 的 主要 意义 

定理 1 设 了 为 单 妖 映射 ，K9 为 f 的 揉 序列 BAL 
= £(KS8), 那么 对 任何 字 IEL, 存在 点 mE [0, f], 使 是 踪 
BEL (ar) AY RR. i 

这 个 定理 的 证 明 见 附录 A， 我 们 只 在 这 里 解释 一 下 它 的 意 
义 ， 以 图 5-16ii) 为 例 ， 这 时 KS—10", xtd n0, 0107 为 
符合 定义 的 允许 字 ， 我 们 已 经 知道 ， 它 们 不 代表 任何 点 o 的 真实 
符号 动力 学 行为 ， 取 它 的 前 绷 , 得 到 三 种 类 型 的 符号 韦 ， 

O'(1«é« n), 071, 0"10"(m7-0), 
FEAR 1-501) ERRA A ey ， 便 了 工 (w) 以 这 些 符号 串 中 的 任 
何 一 个 为 前 级 ， 这 样 就 表明 ， 虽然 不 存在 wET, $ Ile) - 0107, 
但 这 个 允许 字 的 任何 一 个 前 缀 则 反映 了 真实 的 符号 动力 学 行为 ， 
无 论 这 个 前 缀 的 长 度 如 何 . 
从 KS h BH .ZCKS) 的 具体 例子 将 在 $7 中 举 出 . 
本 节 以 下 部 分 用 于 讨论 定义 工 = 乡 (KS) 中 的 各 种 理论 问题 . 


$6.2. 揉 序列 含 符号 5 的 情况 


在 语言 王 =. 乡 (的 9) 的 定义 中 , RP KS 可 以 含有 符号 o 但 
允许 字 和 工 中 的 字 则 只 由 符号 9 和 1 工 组 成 ， 当 S 含 时 只 写 
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到 c Ab ALT. 
在 今后 我 们 主要 考 典 不 含 符号 e 的 揉 序列 ， 我 们 在 这 里 说 明 
一 下 , 这 样 做 对 于 语言 .2 (K8) 的 讨论 不 会 造成 损失 . 
实际 上 , 如 果 有 一 个 揉 序列 
| KS = 0404: --, 467, 
HETE mman 中 不 出 现 H 8 5.9 的 讨论 可 见 这 时 的 KS 
为 周期 序列 
KS = (a192:*8,30)7, 
现在 规定 ， 当 har an ABBA anm, 而 当 moa. a 为 奇 
HN La, - 10E Tf HORAE ERE BJ SC X, 8 5.9), 然后 定义 
K= (Mg n) 
利用 [22]、!26] 中 的 结果 ， 可 以 知道 KS, 也 是 某 个 单 峰 映射 的 摊 
序列 . 
从 人 允许 字 的 定义 容易 知道 , 如 s ART KS By fo VES, 则 它 也 
是 关于 KS, 的 允许 字 , 反之 亦 成 立 ， 这 样 就 得 到 
A(K8) --Z(K&). 
因此 在 今后 可 以 限于 只 讨论 不 合 符 号 o 的 揉 序列 所 确定 的 形式 诸 


Ez] 


A 


WBE Se HA, ERAD Aa [21] X] 2 DLE AT FE 33 1 5 45 
相同 . 


$6.3 周期 多 许字 与 周期 轨 


今后 可 以 看 出 ， 从 揉 序列 出 发 容易 确定 各 种 周期 允许 字 的 存 
在 性 . 但 是 有 一 个 基本 问题 要 讨论 ， 即 周期 允许 字 的 存在 与 原来 
的 单 峰 喘 射 的 真实 周期 轨 的 存在 之 间 有 什么 关系 。 对 于 图 5-1 的 
讨论 已 说 明 一 个 允许 字 未 必 是 真实 轨 的 反映 . 可 以 证 明 ， 对 于 周 
期 允许 字 ， 这 种 情况 不 会 发 生 ， 换 句 话 说 ， 在 讨论 周期 轨 的 问题 
E, 粗 粒 化 描述 方法 是 完全 成 功 的 ， 确 切 的 结论 如 下 . 

定理 2 设 KS 是 不 含 符号 c 的 择 序 列 ， 如 果 s 一 B” 是 关于 
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KS ih— 4-838 fo VPE, NR [BI OIR B HRE) 那么 在 
在 周期 点 cC I, 使 s= 工 2)， 同 时 周期 轨 £P" (2 的 最 小 周期 与 s 的 
SEIL 如果 BB 为 奇 串 ， 则 还 可 能 在 在 最 小 周期 为 2181 
的 周期 辆 . 

现在 给 出 这 个 定理 的 证 明 . 

DPR SB" CEBMRAF, MMR ISO 成 立 o'(s)<s, 
否则 , 可 以 在 

s, ols), e+, oF) 
PB RE s, 以 符合 这 个 假设 . 

先 证 明 存 在 某 个 点 El， 使 s=I(z)， 如 果 有 RS8 一 s， 则 已 有 
s-ICf(e)), MIRKSss, WAS<KS As 是 移 位 最 大 字 ， 
因此 对 每 个 >0, 成 立 

o'(s) « KR, 
应 用 $5.4 中 的 充分 条 件 , 就 知道 存在 2€ I, 使 = 二 TC(w)， 但 这 个 
e RGA ARA. 

现在 引用 符号 动力 学 方面 的 一 个 基本 定理 . 它 的 肉 容 是 : 如 
RENE I (c) - AB 为 终极 周期 序列 ， 其 中 B 的 长 度 已 为 最 
AN, WW fO 收敛 于 某 个 周期 轨 ， 这 个 周期 轨 的 最 小 周期 5B 
为 偶 串 时 等 于 | 了 |, ARBAB STB RAAB! 关于 这 个 
定理 的 证 明 可 看 121] [22] 等 文献 . 

应 用 这 个 定理 于 s—1(2), 25 BORN BP SUM NDS IBI 
JEn SBARRNA CMMI BEER A 2 jB] 
的 周期 轨 ( 但 未 必 为 极限 周期 轨 ). 

利用 临界 点 6 不 是 周期 点 的 这 个 条 件 ， 可 以 从 定理 的 证 明 中 
贸 出 上 述 周期 为 | 吾 | 的 周期 加 的 踪迹 即 是 BUS 当 BOMAPHR BEIGE 
可 能 存在 倍 周期 罗 , EEU Be Wee. WHE, 

Bz, MRBA-*+R BMS Oo), BAER RMI (2) 
-— ÁCf'G)) FERRARO. 将 上 述 证 明 中 引用 的 定理 直接 用 到 这 
AAR f(a) bk, AL I) ALS Pe) 的 最 小 周期 
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相等 ,或 者 是 它 的 一 半 . 

对 于 揉 序列 中 食 符 号 o 的 情况 ， 定 理 2 需要 修改 ， 这 时 存在 
某 些 周期 允 许字 ,它们 不 蚌 任 何 点 的 踪迹 ， 由 于 下 面 主要 讨论 不 
B oc 的 揉 序列 , 我 们 不 再 讨论 这 个 问题 . 


$6.4 由 语言 确定 探 序列 


我 们 已 经 定义 了 由 抒 序 列 KS 确定 的 形式 诺言 ZZ(K9)、 在 
某 些 情况 下 ， 我 们 需要 从 语言 出 发 研究 揉 序列 ， 这 时 下 面 的 结果 
是 有 用 的 . 

设 KS, 和 KS. JE i 4- Ho PESE EPA, 它们 都 不 含有 符 导 
e, 那么 有 

.2(KS) =Z (K8) > KS, = Kf, 

证 明 是 简单 的 ， 从 KS 来 看 ， 它 本 与 是 移 位 最 火 字 ， 因 此 它 
也 是 关于 自身 的 允许 字 . 由 语言 SKS) HERR, KS 的 每 
一 个 前 缀 都 是 语言 SZ OKSO ig. 

从 Z(K8i) = 2 (KS), WL KS. 的 每 个 前 缀 也 是 -Z( 玉 人) 
mass A -9( 有 KK 和’) 的 定义 推出 KS 的 每 个 前 级 «KE. ED 
知 KS « KS, 

同样 可 以 证 明 KS;« KS, 因此 KS, = KSs, 

这 个 结果 表明 ， 不 同 的 揉 序列 所 确定 的 形式 语言 一 定 是 不 相 
邮 的 ， 这 就 是 说 ， 从 揉 序列 KS 到 形式 语言 L=. 多 (KS9) 的 对 应 关 
系 是 一 一 对 应 . 
$6.0 语言 定义 的 收 改 

研究 从 择 序 列 定义 形式 语言 的 其 他 方法 , 

可 以 认为 在 36.1 中 的 定义 方法 是 以 $5.4 中 的 必要 条 件 为 
基础 的 、 如 改 成 以 那里 的 充分 条 人 忻 为 基础 , 可 定义 另 一 形式 语言 ; 

In={t€ (0, 1}*| 在 在 出 符号 0 和 二 组 成 的 无 限 序 列 s， 
st NWR, HHT i> 满足 条 件 o'(s) < KS}, 
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MELTA, 
L,cL-.g(K8), 
容易 找 出 例子 , LaL. RAMA 
定理 8 如 果 揉 序列 KS 不 是 周期 序列 , WA 
I, =L=£(KS8), 
这 个 结果 不 仅 探讨 了 形式 语言 定义 的 第 二 种 可 能 方式 ， 在 今 
后 研究 非 周 期 揉 序列 时 也 有 用 处 .定理 3 的 证 明 亦 写 在 附录 A 中。 
§6.6 语言 定义 的 另 一 种 修改 
对 于 工 一 多 (改色 还 可 以 作 另 一 种 收 改 ， MBSE 6.1 + he, 
许字 的 定义 改 成 只 要 求 对 51 满足 o (S) «KS, 那么 所 得 到 的 形 
式 语言 将 不 仅 反 瞻 了 zE [0, fo)] 时 的 动力 学 行为 ， 而 且 世 包括 
T e€(Cf(o), 1] 时 的 动力 学 行为 ， 我 们 将 这 样 的 语言 记 为 二. 
今后 将 看 到 , 对 于 工 进行 研究 比较 方便 同时 , 如 8 6.1 中 所 
Vi, 将 区 间 工 = [0, 1] 改 为 [0，f(0)] 不 减少 讨论 的 一 般 性 
但 是 工 与 工 的 关系 仍 应 考 典 、 特 别 是 在 作 语 言 复 杂 性 分 析 
时 , 讨论 工 和 工 是 否 等 价 , 这 是 一 个 需要 解决 的 问题 . 
从 定义 即 可 建立 
L- 10, 1}L, 
其 中 将 {0, 二 看 成 只 由 两 个 长 度 为 工 的 字 组 成 的 语言 ， 等 式 右 方 
是 两 个 语言 的 连接 (和 参见 8$ 工 .9)， 
也 可 以 将 上 与 工 的 关系 改写 为 
L={0}L y {1}L, 
现在 可 以 建立 以 下 结果 . 
如 果 考 虑 在 第 工 章 中 介绍 的 以 下 六 个 语言 类 中 的 任何 一 个 : 
S (RG), V (OF). .Z (OS) LRE) ,.Z(ETOL) MZ (IND), lij 
L 和 王 一 定 同属 于 其 中 的 一 类 . 
这 就 是 说 ,在 上 述 意 义 下 ， 对 工 和 荆 进行 语言 复杂 性 分 析 是 
8$ Ur RS. 
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以 下 对 这 个 结果 作出 证 明 . 
记 7 为 其 中 的 任何 一 个 语言 类 . 
由 于 这 六 个 语言 类 关于 连接 和 取 并 运算 封闭 因此 从 
LEY SLE F, 
BZ, LEZ. 利用 名 关于 正规 语言 取 交 为 封闭 , 可 推出 
{0}L=LN {0} (0--1)* € F, 
定义 从 (e, 0, 1}* 到 (0, 11* 的 一 个 同 态 为 
h(a)=0, h(0)=0,  A(1)-1, 
其 中 < 为 一 个 辅助 符号 ， 这 时 有 
is). 4 (40)L) N (a (027 1*, 
$1 R3 -Z 2 T RASH Bj, 可 见 {ajDE 2, 
再 引进 一 合同 态 9 为 
g(@ =s,  g(0)=0,  g(D-1 
并 利用 LS 关于 有 限 删 除 运 算 (Limited Erasing) 封 闭 ， 就 得 到 所 
m uit. 
L=g({a}L) €.Z. 
以 上 所 用 到 的 知识 可 参看 中] 的 第 13 RR, 


第 3 章 


区 间 映 射 中 的 正规 语言 


上 一 章 给 出 了 由 揉 序列 确定 的 语言 乡 (KS) 的 定义 这 一 党 
将 对 于 其 中 的 正规 语言 进行 彻底 的 分 析 .， 主 要 结果 是 给 出 了 从 评 
序列 KS 出 发 直接 判定 和 (KE8) 为 正规 语言 的 方法 同时 在 
(RK9) 为 正规 语言 时 , 给 出 了 从 KS 出 发 构造 接受 SKS) IIR 
小 确定 性 有 限 自动 机 的 方法 . 

第 7 节 对 于 语言 (KS) 所 具有 的 两 个 基本 性 质 作出 讨论 ， 
对 于 给 定 符号 串 z 和 揉 序列 KS Bw ce .ZC(K9) 的 判定 方法 . A 
BY, 引进 一 个 符号 捉 相 对 于 某 一 抒 序 列 的 前 后 缀 这 个 重要 概念 . TE 
在 建立 有 关 理 沦 时 是 非常 有 用 的 工具 . 

第 8 节 以 几 个 定理 的 形式 给 出 本 章 的 主要 结果 .， 在 研究 接受 
-ZE(K9) 的 有 限 自 动机 的 基础 上 ; 证 明 YES) EMR HN, KS 
一 定 是 周期 序列 或 终极 周期 序列 它 的 逆 命 题 也 成 立 ， 其 证 明 则 
请 看 附录 了 3 在 那里 还 建立 了 一 些 重要 的 概念 和 绚 理 。 在 这 节 
# i D) KS= 100(101” 为 例 介 绍 了 马尔 可 夫 划 分 (Markoy 
Partition) 的 方法 . 

在 第 9 节 中 对 于 以 上 两 类 正规 语言 给 出 了 相应 的 有 限 自动 机 
的 构造 方法 ， 介 绍 了 最 小 确定 性 有 限 自动 机 的 状态 个 数 的 计算 方 
法 , 列举 了 大 量 的 例子 以 供 人 参考 . 

在 一 定 条 件 下 可 以 将 揉 序列 为 周期 序列 时 的 动力 学 行为 看 成 
为 正规 运动 ， 而 将 探 序列 为 终极 周期 序列 时 的 动力 学 行为 着 成 为 
随机 性 很 强 的 粗 将 混沌 .本章 和 的 结果 表明 ， 从 形式 语言 的 角度 来 
A, 这 两 种 系统 的 复杂 程度 都 不 高 , 在 乔 姆 斯 基层 次 中 处 于 最 低 的 
正规 语言 这 个 层次 上 (关于 它们 之 冯 的 差别 将 在 第 巧 Wine). 
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应 当 着 重 指出 的 是 , 对 上 述 两 种 运动 的 复杂 性 刻 划 , 采用 形式 语言 
工具 得 到 了 共 他 已 有 方法 所 没有 提供 的 新 的 认 误 . 


§ 了 关于 语言 的 一 般 性 讨论 


本 节 先 举 一 些 例子 , 然后 指出 语言 工 ~ - 乡 (K8) 所 具有 的 两 个 
基本 性 质 ， 它 们 也 是 本 书 中 所 涉及 的 来 自动 力 系 统 的 其 他 形式 语 
言 所 共同 具有 的 性 质 ， 对 于 给 定 的 符号 串 2 和 揉 序列 KS, 给 定 
T s€ (KS) 的 判定 方法 ， 引 入 前 后 缀 概念 为 今后 作 准 备 . 

本 节 材 料 主要 取 自 [85]~[39]， 所 需要 的 语言 知识 见 本 书 的 
8 1, 


$ 7.1 关于 满 射 情况 的 讨论 

作为 =-2(KB) 的 第 一 个 例子 ， 研 究 单 话 映 射 f [0, 1] 
[0, 为 满 射 的 情况 . 按照 $5.1 中 的 定义 , 这 时 的 把 序列 为 
107. 这 也 就 是 图 扩 1 中 的 情况 ， 对 于 二 次 方 肌 射 族 ， 即 参数 5 
一 生 的 情况 : 

f(o) —-42(1-—2), Ox ce, 

[ 例 1] ži F KS=10", R L-.Z (KS). 

按照 $5.3 中 关于 序 的 定义 ，10" 是 最 大 可 能 的 符号 串 ， 因 
此 , 自 符号 0 和 工 组 成 的 任何 无 跟 序 列 s 都 满足 多 许字 的 条 人 性; 对 
每 个 i>0 成立 g'(s) 所 10~.， 由 此 可 知 ， 语言 u0mse Bi 
导 0 和 1 组 成 的 任何 有 限 序列 , B] 

ZL (107) = 8*, 

其 中 S={0, 1}, 

由 此 可 见 ，x 交 (10”) 是 正规 语言 ， 从 所 包含 的 字 的 多 少 来 看 ， 
是 单 峰 呐 射 中 最 大 可 能 的 形式 语言 。 关于 这 个 语言 的 最 小 确定 性 
有 限 自动 机 及 其 正规 表达 式 可 参看 第 工 节 中 的 图 1-2. 从 以 后 的 
叙述 会 知道 , 在 区 闻 映 射 的 形式 语言 中 , 没有 比 这 个 例子 更 为 简单 
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的 情况 . 

将 这 一 点 与 其 他 方法 的 研究 结果 作 比 较 是 很 有 意义 的 ， 下 面 
所 提 到 的 各 种 概念 可 人 参见 [24]~'[39] 或 本 具 书 中 其 他 各 册 的 介 
绍 . 

李 雅 普 诺 夫 指 数 (Lyapunov Exponent) Al Ra 3& BEY AR 
来 性 态 对 初 值 的 微 殷 动 的 依赖 关系 ， 即 关于 初 值 的 敏感 性 对 于 
=P RS BOL, P f(e)—4z(1—2), 可 以 用 解 术 方式 计 
算出 李 雅 普 诺 夫 指 数 和 一 4 《在 计算 中 取 对 数 的 认为 2), 即 对 初 值 
的 敏感 性 很 强 ， 但 容易 看 出 ， 李 雅 普 诺 夫 指数 不 可 能 仅仅 从 抒 序 
列 来 确定 ， 而 必须 依赖 于 映射 的 进一步 的 分 析 性 质 ， 这 与 我 们 从 
SEIT AI 107 出 发 的 研究 角度 是 不 一 样 的 . 

关于 测度 篇 的 情况 大 致 相同 .测度 粹 是 关于 某 个 不 变 测度 来 
计算 的 景 ， 而 不 变 测 度 的 存在 及 其 性 质 与 映射 的 分 析 性 质 有 密切 
联系 ， 这 里 不 再 讨论 . 

拓扑 焙 的 研究 与 形式 语言 方法 有 密切 联系 ， 第 5 章 将 从 语言 
Ar 8) FEE fü BOSE IR TIMB ETE ST 3E. 

M - (107) = S* 可 以 看 出 ， 这 里 所 反映 的 纯粹 是 轨道 的 符号 
动力 学 行为 的 多 样 性 . 这 时 的 多 样 性 达到 了 如 此 程度 ， 以致 于 任 
何 一 个 FEN PMS LOOM) HBB. TAU, 任何 一 
个 单 峰 上 映射 的 任何 轨 的 符号 动力 学 袁 现 ， 即 85.2 中 的 工 (z) 
一 4( 产 (w))， FAV RRAN HDD RAP RRA, FRG 
当 的 初始 点 2 Bay, Soop ede A ENANTA IS FREE. 

LEBERE ARIE T X-— Ju X HRY A ES-— 107" 
PRE, 而 与 映射 的 其 他 性 质 无关 ， 可 以 将 这 种 性 质 看 成 为 某 种 
普 适 性 或 通用 性 形式 语言 方法 吉明 ， 正 由 于 这 种 普 适 性 或 通用 
性 ， 即 多样 性 达到 最 大 程度 ， 因 此 其 语言 结构 却 是 简单 语言 (指正 
规 语 言 ) 中 最 简单 的 一 个 . 

实际 上 这 完全 由 KS—107 决定， 而 与 映射 了 是 否 是 满 射 ， 是 
否 有 稳定 周期 轨 , 是 否 具 有 某 种 确定 类 型 的 非 游 葛 集 都 没有 关系 . 
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E] 7-1 342571 10" HSE AIST ORR, PRD AES 5- 工 的 补 
充 ， 其 中 (全 有 稳定 不 动 点 ， (ii 有 稳定 周期 2 p (D 以 一 个 碌 
FES (Cantor Set) ü— RA AA 3E 38 KR. ULT E (107) 
=S 上 完全 一 致 、 我们 可 以 说 , 如 果 符 号 动力 学 是 通过 粗 粒 化 描 
述 来 研究 动力 系统 的 方法 ， 则 采用 形式 语言 为 工具 是 一 个 很 自然 


(i) Gi) (ii) 


$7.2 两 个 简单 例子 


[ 例 2] 对 于 KS=0” 求 形式 语言 . 

与 10” 恰恰 相反 ,KS=0” 是 所 有 揉 序列 中 最 小 的 一 个 ， 由 
此 已 可 推出 ， 满 足 86,1L EL HRS RA, BP KS=0" 9 
身 ， 这 样 就 求 出 

-Z (07) ={0"|n=0}, 
它 是 正规 语言 ， 其 正规 表达 式 为 0"( 参 见 $1.5)。 在 图 7-2 中 给 
出 了 以 0 为 揉 序列 的 两 个 单 峰 映射 和 接受 语言 O 的 最 小 确定 性 
右 限 自动 机 这 个 自动 机 只 有 机 个 状态 . 初 态 也 就 是 终止 态 ， 用 
一 个 小 辕 点 外 加 一 个 圆圈 代表 、， 另 一 个 是 非 终 止 态 ， 由 一 个 空心 
小 圆 表示 . 

图 () 中 的 映射 以 w=0 为 稳定 不 动 点 ， 图 (起 中 的 映射 以 
2=0 为 不 稳定 不 动 点 , WER, ec) 中 还 有 一 个 稳定 不 动 点 , 当 
然 还 可 以 作出 更 复杂 的 和 例子, 包括 有 无 限 多 个 不 动 点 的 情况 ， 但 
Fa FRE — B] fe YrtE 07, 从 86.3 的 定理 2, 可 知 这 时 不 可 能 有 不 
动 点 之 外 的 任何 周期 轨 ， 
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Al Aloo 


Gi ii) 
图 7-2 

对 于 二 次 方 映 射 je ba l—o), KM 4 TO<d<2 h A 
i, 

[AS] 对 于 EKS=1” 求 形式 语言 . 

按照 多 许字 的 定义 可 见 只 有 有 0 MERK 01" 20) 3X ES 
多 许字 .到 它们 的 所 有 前 级 , 就 得 到 形式 语言 

(17) - (01715270, mz0]. 
这 即 是 在 第 工 章 的 图 七 3. 中 讨论 过 的 正规 语言 ， 它 的 正规 表达 式 
ECI EW 1-3üi MEINT EZ 多 (1”) 的 最 小 确定 性 有 限 自动 
p. 

从 KS- 1" 容易 看 出 只 存在 两 个 周期 多 许字 , 即 07 5; 17, 按 
照 §6.38 的 定理 2 可 知 存 在 以 O7 为 踪迹 的 不 动 点 ， 以 卫 为 踪迹 
的 不 动 点 , 还 可 能 有 以 17 为 踪迹 的 周期 2 SL. 

以 二 次 方 上 映射 为 例 , 参数 5 处 于 (2, 1+w5) 时 揉 序列 为 
K8-1" Hp bE (2, 3] 时 只 有 不 动 点 ,5E (8, 12-/ 5 HBA 
833 2 8h. 

E] 1-3 是 以 工 为 探 序列 的 一 个 单 峰 映射 的 图 象 和 接受 语言 
LL") RhA SE EE Bk OB SL 


图 7-3 
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$1.8. 关于 正规 语言 的 一 般 问题 

HERB- RAG: KYW KSR ATARI, A 
了 (KS) 是 正规 语言 ? 已 经 有 一 系列 工作 指出 ， 当 抒 序 列 为 周期 序 
列 或 终极 周期 序列 时 ， 单 峰 上 映射 的 符号 动力 学 行为 可 以 用 正规 语 
言 描述 (参见 [35] 一 [49j， EZ, #195], [36], [98] rp MEH, 
当 (KS) 为 正规 语言 时 , HFA KS 只 可 能 是 上 述 两 种 情况 ， 因 
此 可 以 认为 ， 在 单 峰 映射 的 形式 语言 中 ， 正 规 语言 的 问题 已 经 解 
RR. 

在 第 8 节 将 从 揉 序列 KS 出 发 直接 研究 语言 (KS) 的 性 质 ， 
而 不 必 如 上 上 面 几 个 例子 那样 每 次 要 求 出 全 部 多 许字 . 在 第 9 节 将 
对 于 - 居 (K89) 为 正规 语言 的 情况 ， 给 出 构造 相应 的 最 小 确定 性 有 
限 自动 机 的 具体 算法 . 这 样 我 们 就 完全 掌握 了 .ZCKS) 的 性 质 ， 
并 提供 了 种 种 正规 语言 之 间 复 杂 程 度 的 比较 依据 . 

这 里 采取 在 [88] 中 的 方法 ， 以 自然 等 价 关 系 BL 和 迈 希 尔 - 奈 
罗 德 定理 为 主要 工具 (参见 $1.8), 同时 还 需要 发 展 一 些 新 的 概念 
和 方法 .在 本 节 的 以 下 部 分 为 此 作 准 备 . 


$7.4. Z7 (KS) 6398 4-3 d 47 


对 于 任何 揉 序列 KS, 语言 (KS) 都 具有 以 下 所 指出 的 两 个 
基本 性 质 ， 

设 符号 集 为 5, HA LCS, 

性 质 1 ELS 的 每 一 个 子 串 EL 

EER EL 至 少 存在 一 个 4， 使 符号 申 zo 也 属于 


现 对 这 两 个 性 质 作 些 解 释 . 
由 于 % 自身 也 是 的 一 个 子 串 ， 因 此 性 质 工 中 的 “<=” 是 平凡 
的 , 重要 的 是 其 另 一 半 “~>”， 语言 的 许多 进一步 的 性 质 均 与 此 有 
x. HMI RBA lL“ KS HERR. CRAME 
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的 动力 学 意义 ， 联 系 到 第 6 节 的 定理 了 性 质 工 表明 ,如 果 某 种 符 
号 动力 学 行为 能 够 出 现 ， 则 它 的 任何 局 部 行为 也 一 定 能 够 出 现 . 

另 一 方面, 不 与 动力 系统 对 应 的 形式 语言 ,就 不 一 定 具 有 这 个 
KR. HUES1.T, 83.8 中 所 列举 的 形式 语言 例子 都 不 具有 性 质 
i 

因此 , 性 质 工 看 起 来 平常 , 实际 上 对 于 动力 系统 中 的 形式 语言 
来 说 是 非常 重要 的 基本 特征 。 除了 区 间 映 射 之 外 , 本 书 第 6 章 元 
胞 自动 机 中 出 现 的 形式 语言 也 具有 性 质 L 

性 质 2 也 不 是 一 般 的 形式 语言 所 具有 的 公共 特征 ， 但 对 于 动 
力 系统 中 的 形式 语言 却 是 经 党 具有 的 性 质 ， 对 于 工 ~ 乡 (KS), 如 
ZEL, 则 根据 定义 (8 6.1), 存在 一 个 允许 字 s 以 * 为 s 的 前 级 .由 
Fs 是 无 限 符号 序列 , 可 见 性 质 2 成 立 . 

同样 可 以 看 出 , 性 质 3 具有 明显 的 动力 系统 意义 , 即时 间 演 化 
在 理论 上 不 受 限制 , 从 当前 时 刻 总 要 演化 到 下 一 时 刻 . 

值得 指出 ， 葛 尔 斯 和 海德 隆 特 (G. A. Hedlund) ARASH 
力学 方法 研究 负 曲率 曲面 上 的 测 地 线 时 ， 曾 经 对 于 所 使 用 的 符号 
中 集合 ( 即 这 里 所 说 的 形式 语言 ) 指 出 过 与 上 述 两 个 性 质 相 类 似 的 
几 个 特征 (参见 [32] 的 892 页 ) 


$7.5 z€ (RKO) 的 判定 法 则 


在 这 一 小 节 中 要 解决 的 问题 是 ， 对 于 给 定 的 符号 串 HU 
yj KS， 济 定 *E .2(KS) 是 否 成 立 。 注意 在 87.4 中 的 性 质 工 并 
未 给 出 这 个 问题 的 直接 回答 .按照 $6.1 中 语言 多 (K9) 的 定义 ， 
要 找 出 一 个 无 限 符号 序列 s% 它 以 4 为 前 级 , 又 满足 对 每 个 $0 的 
条 件 o (S) « KS, 这 也 是 不 切合 实际 的 . 

gE £ (KS) pj JA EENE, a HE 

og) KS 
xpo«i-c|z|m M 6 sr. RUE HARA KS 作 比 较 , 等 号 
9, 3r 89 AMAA A PB I 右 方 的 揉 序列 的 前 级. 
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HT o'(z) FE 0i [e| BER 2 这 个 符号 串 的 所 有 非 空 后 级 ， 
包括 e 自身 , 因此 这 个 判定 方法 的 应 用 是 很 方便 的 . 
从 语言 L= 名 (KK8) 的 定义 容易 看 出 ， 任 何 一 个 有 限 符号 串 ， 
Andi 8 5.9 的 序 的 定义 不 小 于 等 于 KS, 这 个 符号 串 一 定 不 属于 工 。 
男 一 方面 , “的 每 个 后 缀 当然 也 是 & HTE. MERITE, 
sD=># 的 每 个 后 级 展 于 LD， 综合 以 上 , 可 见 在 漳 定 方法 中 给 出 
的 条 件 是 zEL 的 必要 条 件 . 这 里 重要 的 大 证 明 这 个 条 件 同时 也 
是 充分 条 人 性 ， 这 个 证 明 将 在 下 面 $7.7 中 给 出 . 
这 里 要 指出 ， 如 一 个 符号 串 的 所 有 前 缀 , 包括 z 本 身 在 内 ， 
都 满足 小 于 等 于 KS 的 相同 条 件 , 仍 不 足以 保证 xE LD， 例 如, 设 
KS =1011011010110---, 
z= 10110110100, 
s 的 每 一 个 前 级 都 满足 上 述 条 件 . 但 是 有 一 个 后 鳗 为 100， 从 
1007 K8, 可 见 100€ (KS), MIME 1, Ap up zd Z (KS). 
这 里 使 用 了 性 质 1 ARIE, MH scCH-— d TR EL RY, 
即 可 推出 * 竺 工 ， 这 是 性 质 工 经 常 使 用 的 形式 . 


87.6 符号 事 的 前 后 组 


在 证 明 上 一 小 节 的 判定 方法 时 ， 需 要 引进 一 个 符号 串 关 于 瓜 
序列 的 前 后 级 概念 . 从 已 进行 的 研究 来 君 , 这 个 概念 非常 有 用 . 

给 定 zE S* REI 9| ES, PRA SS Bos JE eX T KS BU RU ie 
ta (Prefix-Suffix), 1158 e' 满足 下 列 条 件 : 

1° y E KS 的 前 组 ， 

2° z X& e initi. 

在 不 发 生 混淆 时 , 简称 上 上 述 光 是 e 的 一 个 前 后 级 

类 似 地 可 以 定义 关于 某 一 个 符号 串 的 前 后 缕 . 

如 果 有 关于 KS 的 前 后 红 ， 则 可 以 将 这 样 的 前 后 组 中 最 长 
的 一 个 定义 为 关于 KS 的 最 长 前 后 缀 (The Longest Prefix- 
Su 组 x)， 在 许多 论证 中 它 起 重要 作用 , 
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现在 讨论 前 后 缀 的 存在 性 . 

WR r 本 身 是 K9 的 一 个 前 缀 ， 则 “本 身 即 是 HT KSA 
(最 长 ) 前 后 级 ， 这 是 平凡 情况 . 

如 sz 针 -ZZ(KS)， 则 zz 未 必 有 关于 及 9 的 前 后 织 ， 在 上 一 小 节 
中 的 例子 即 是 如 此 ， 

Mee L (KS), -PRPVWRAKF KS HARA. in 

z—-01, KS-0^", 
BUR 
2-000, KS=(10)", 
都 是 如 此 ， 但 实际 上 这 是 z€E 多 (KS) 时 仅 有 的 两 种 例外 情况 ,这 
里 有 下 面 的 结果 . 

Bkz ZES), Hh KS207, 不 是 只 由 符号 0 组 成 
KHE 那么 * 存在 关于 KS 的 前 后 级 ， 从 而 也 存在 关于 KS 的 最 长 
前 后 级 . 

证 明 由 于 有 9 蚌 移 位 最 大 字 ， 嗓 然 它 不 会 是 0"， 则 KS 必 
从 符号 1 开始 . 

如 果 % 的 最 后 一 个 符号 EL Me =1 就 是 xz 关于 KS 的 一 个 
前 后 组 . 

im z 的 最 后 一 个 符号 为 0, 网 由 于 “不 是 0 串 , 因此 % 的 后 
级 中 一 定 有 一 个 具有 形式 为 10" WER, m0. Heel, Ke 
Wl 10"CL 因此 10"« KS, AARET KS 一 定 以 10" 为 前 
级 ， 因 而 10" Be 关于 KS 的 前 后 缀 . 
$7.7 判定 法 则 的 证 明 

如 前 所 述 ， 对 于 给 定 的 ?和 KS， 只 要 证 明 ， 如 “的 每 一 个 后 
级 (包括 z Se KS, M ec L- (KS), 

按照 ZOIKS MES, qEHiE— fV subs. 

分 两 种 情况 ， Anz WEP v WORRIES 则 只 
ES 

çI 


s=2- K8, 
其 中 记号 “为 符号 串 的 连接 ， 这 时 对 每 外 40 成 立 
o'(s) « KS, 
另 一 种 情况 是 rmm KS 的 前 级 , BFE «KS 中 成 
立 等 号 的 情况 . 这 时 有 关于 KS 的 前 后 级， 取 其 中 最 长 的 一 
个 , 即 关于 KS 的 最 长 前 后 缀 , 将 8 分解 为 
g $122, 
Hh za 是 z 关 于 KS 的 最 长 前 后 级 . 
现在 取 
$—£,* KS, 
这 个 无 限 符号 序列 s Le HARA KS UL os 2g BIRD. BBY 
$270 的 每 个 o' (s). 
如 果 62» | |, 则 
o'(s) =o (KS) KR 
这 里 利用 了 KS 为 移 位 最 大 字 ; 
AR I< [zi], W 
o'(s) 2 o'(z) - KS, 
hF z 是 2 关于 五 8 的 最 长 前 后 缘 , 而 目前 
| ofa) | > 1a, 
因此 成 立 of (2) << KS, 从 而 也 有 
o'(s) « K8, 
这 样 我 们 就 证 明了 s 为 允许 字 , 从 而 得 到 EL, 
一 个 简单 推论 ，zE 工 = 一双 (K8) 的 充分 必要 条 性 是 ,，z 的 每 一 
FB eS KS, 


88 KAFAAR EME 


JN WE A MER] KS 直接 判定 (KS) 是 否 为 正规 语 
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言 , 并 给 出 充分 必要 条 件 ， 材 料 主要 取 自 [385]、[36] 、[38] 等 ， 定 
于 和 和 3 的 证 明 放 在 附录 B 中 . 


$8.1. 有 限 自 动机 的 特征 分 析 


从 8$7.4 知 道 语言 工 一 和 (Kg 必然 具有 的 两 个 基本 性 质 , 作 
为 它们 的 应 用 , 我们 来 研究 当 工 为 正规 语言 时 ， ALBAK 
动机 必然 会 具有 的 一 些 特征 . 

这 里 关心 的 问题 是 , 从 给 定 的 揉 序列 出 发 . 直接 研究 语言 以 及 
白 动 机 的 性 质 . 主要 的 工具 是 在 81,8 介绍 的 自然 等 价 关系 RL 
和 迈 希 尔 -~ 奈 罗 德 定理 ， 为 读者 方便 起 见 ， 以 下 先 重 复 叙 述 BL 的 
EX. 

设 工 三 为 一 个 形式 语言 8 一 {10, 1), WL S* 中 产生 一 
个 自然 等 价 关 系 Re: KS PRE S Ug Ds Br St, 记 为 Ry, 
WEIHER ES", az 和 gs AAT L, 或 者 同时 不 属于 L. A 
ARW Ri MES RAM=HT RAC 81.8), HE BL 等 价 类 记 
Ala), 其 中 四 是 这 个 类 中 的 任何 一 个 符号 囊 ， 这 样 的 记 法 就 是 说 
以 o 作为 这 个 等 价 类 的 代表 元 . 

WERKE Ri 的 指标 。 迈 希 尔 ~ 奈 罗 德 定理 的 一 个 内 
Fit, WAL HEM RS DERE RAR. x 
个 定理 的 另 一 个 内 容 是 , 将 每 一 个 等 价 类 作为 一 个 状态 , 就 可 以 从 
等 价 类 之 间 的 自然 关系 构造 出 接受 语言 工 的 自动 机 ， 如 果 Rus 
有 限 指标 ， 这 就 是 接受 正规 语言 工 的 最 小 确定 性 有 限 自动 机 如 
RR 为 无 限 指标 ， 则 所 得 到 的 是 具有 无 限 个 状态 的 自动 p. 它 
除了 状态 为 无 限 这 一 点 之 外 ， 在 其 他 方面 与 确定 性 有 限 自 动机 完 
全 一 样 . 在 本 节 中 的 自动 机 即 指 这 两 类 自动 机 . 

从 Ri 的 定义 可 见 , 如 wRrg, Weme Mr), 则 推出 s 和 yy 
RART L, 或 都 不 属于 L， 这 是 BRL 的 必要 条 件 . 

从 工 玫 (KES) 的 基本 性 质 工 见 8$7.4) 可 以 看 出 有 

EL, yf L> sR 成 立 ， 
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这 是 因为 对 任何 zE S", E ze 和 gs 3 REIR DB. 
在 本 书 中 用 记号 L HRB LOS g Sh Arkh, BD 
L/'-S*-—L, 


Sk L' LR. 

由 上 可 见 ， 对 于 具有 人 性质 工 的 任何 形式 语言 卫 EAL 必 
是 BL 的 一 个 等 价 类 , 即 有 

s, YEL’ = oR, 
eel’, yRpa > yEeL’, 

HATE sE 工 乃 是 性 质 革 的 推论 ， 因 此 总 有 sel’ xr. 

联系 到 迈 希 尔 - 奈 罗 德 定理 的 证 明 过 程 ( 见 [4])， 我 们 知道 在 
用 Br 等 价 类 构造 自动 机 时 , 30 ec L, 则 [zs] 为 自动 机 中 的 终止 状 
态 , MoE L, 则 [oo] 为 自动 机 的 非 终 止 状 态 ， 因 此 得 到 结论 ,接受 
具有 性 质 工 的 形式 语言 的 自动 机 , 只 需要 一 个 非 终 止 状 态 . | 

同样 还 可 以 知道 ， 由 以 上 非 终 止 状 态 出 发 的 每 条 弧 只 能 转移 
到 非 终 止 状态 . 7-2 和 Y-8 上 的 自动 机 都 具有 这 些 特征 ， 

为 方便 起 见 , 我 们 约定 在 今后 的 自动 机 示意 图 中 , 略 去 从 非 终 
止 状态 ( 它 用 空心 小 圆 代 表 ) 出 发 的 弧 ， 实 际 上 这 种 状态 即 所 谓 死 
RAS, 一 旦 进入 , 再 不 出 来 . 

唯一 的 例外 基 KS-—107, 3x tj L—-.27/(107) -8*, =O, A 
此 不 存在 非 终 止 状态 ( 见 图 1-2), 

现在 考虑 8$87.4 中 的 基本 性 质 2.， 它 在 自动 机 中 的 意义 是 非 
常 清楚 的 , 即 从 任何 一 个 终止 状态 出 发 , 在 标 有 0 和 工 的 弧 中 间 至 
少 有 一 条 通 向 到 一 个 终止 状态 . 也 就 是 说 ,不 可 能 发 生 从 一 个 终 
止 状态 下 发 的 所 有 弧 都 通 向 到 非 终 止 状态 的 情况 . 

换 一 个 说 法 , 如 果 工 具有 人 性质 2, MARZ EM AME, 那么 
可 以 在 M PIER LAU Rl CMR AURA, 这 时 从 留 下 
的 任何 一 个 终止 状态 出 发 ， 在 状态 转移 图 中 存在 长 度 为 任意 的 路 
径 . 
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$8.2 HER, $e np 

ik L= Z (KS), iu RL 的 指标 为 N 

[mi] N-—-1oRKS-—10* 

ic H gc mARBTST.Iqs.S3mEANL-S' 可 知 五 .只 
有 一 个 等 价 类 .， 它 的 自动 机 见 图 1-2, 

现在 考虑 "=>” 的 证 明 . 

ins 名 = 她， 则 由 于 每 一 个 形状 为 OM ATL, 利用 
10"« KS 对 每 个 叹 成 立即 可 推出 KS-- 107. 

WE LAD, WF LHL KS) ASRS, A B. 前 
指标 浆 = 工 相 了 矛盾 .这 时 至 少 在 两 个 Re SHB, 

f 例 21 N-2eKS-0*7 

讨论 必要 性 部 分 ( 即 “ 0. Su N-—2, M inp us Ls", 
即 了 关 人 ， 于 是 已 经 有 一 个 BL 等 价 类 为 工 ， 由 sE 工 可 知 有 一 
Ae MK Le CH, 

现在 分 析 [s] 中 前 内 容 , 这 时 容易 确定 对 任何 m> FO" Ais 
or. 实际 上 如 果 了 S 不 是 0"， 就 必 是 从 符号 二 开始 . 如果 
zl, WHER 8 7.4 Bp EU, 2578 0"w 的 所 有 后 级 ， 即 可 推出 
OzeL, Rz,0zcLoscLIiW mia. 

现在 观察 在 等 价 类 [e] 中 是 否 含有 其 他 符号 下 如果 假设 在 
[ 引 中 含有 一 个 不 全 为 符号 0 组 成 的 串 ， 则 可 看 出 符号 工作 为 字 已 
属于 工 (应 用 性 质 1)， 因 此 揉 序列 KS 从 1 开始 . 由 于 六 一 2, 我 
们 也 有 1€ [2] 成立. 

MO" Rr 出 发 , Xt e— O^, n [E XR, XXL HE HI 077^ R10", 特别 是 
由 此 得 出 10"E 工 对 每 个 nz0 成 立 ， 这 直接 导致 天 8 一 40” 了 引 
Fifi 1, np 95 N —2 MAB. 

这 样 就 从 N=2 推出 1EIL，K8S8 从 0 开始 ， 因 此 KS-07, 

REA Ba SE BE 

L’ 5j [s] = (0" | SO}, 
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A K8-0* 出 发 , 容易 确定 工 -= $1007, 这 在 $7.2 的 例 2 中 
已 讨论 过 , 3x JA i. 

[ 例 3] =3 会 RS= 1 

设 六 -3 成 立 ， 则 从 例 2 可 知 揉 序列 KS 必 是 从 符号 工 开始 
的 . 

利用 在 例 2 中 的 同样 讨论 可 以 知道 这 时 存在 Rr 的 三 个 等 价 
类 : Ce], [1] 5 L^, Hop e] = (07120) 与 例 2 也 相同 ， 

考虑 符号 串 10， 这 时 有 两 种 可 能 ， 如 果 10EL， 则 KS 也 必 
cM 103fh8. RN N-8549[1x5 KS3107, ix KS—10'l.-., 
n>0, AFN=8, MICLARAIOEC [1], BpioR,l, Re 
=O", W 10e £L, 而 12€ L, 引出 矛盾 . 

于 是 只 可 能 是 10EI'， 同 时 KS 不 能 以 40 为 前 级 ， 因 此 就 
得 出 KS= 1” 的 结论 

从 KS—-17 推出 站 =8 是 比较 容易 的 , 这 里 从 赂 .关于 -2(1) 
的 讨论 见 87.2 的 例 8. 

E. WF RMR NDS 的 情况 ， 由 以 上 讨论 已 知 有 三 个 
等 价 类 : [63 [1] 55 L’, Hp [8] = (07| m0) 总 是 成 立 的 . 


$8.3 主要 结果 及 其 证 明 


现在 叙述 并 证 明 本 节 的 主要 结果 . 

定理 1 如 果 由 揉 序列 KS 确定 的 形式 语言 ZEDA ER 
语言 , 则 KS 是 周期 序列 或 终极 周期 序列 . 

证 明 ， 记 语言 L=.9(KS)， 由 于 工 是 正规 语言 , 存在 接受 
L 的 最 小 确定 性 有 限 自 动机 M, 记 为 

M=(Q, 8, 8, qo, F), 

Xp 8-10, 1}, QXpti Bus fl FQ REUS MS. e C QI 
ULGEIITINMEE XE. TE RE ERE TUE 
的 文献 . 

从 $8.1 的 讨论 已 知 ' 除了 8S=10” 这 个 唯一 的 例外 ， 在 


$6 


4- 中 只 含有 一 个 状态 ， 它 对 应 于 R 的 等 价 类 L AF KS 
= I0” 豆 是 终极 周期 序列 , 在 83.2 的 例 工 中 已 作 过 讨论 ， 因此 在 
证 胡 的 以 下 部 分 假定 KS 了 10~"， 这 时 区", L's 5, 

在 88.1 中 已 经 证 明 ， 从 集合 的 任何 一 个 状态 出 发 ,都 在 
在 长 度 为 无 限 的 路 径 ， 而 生 它 完全 在 集合 (以 及 琅 关 的 弧 的 集 
合 ) 之 中 . 

MeL WWM LEF, 

现在 从 go 出 发 寻找 完全 落 在 五 中 的 一 条 特殊 的 路 径 ， 它 在 
今后 被 称 为 极 大 路 径 . 

这 时 利 册 在 $1.4 中 介绍 的 状态 转移 图 从 几何 上 观察 问题 是 
非常 方便 的 , 这 时 状态 即 是 结 点 . 

记 一 条 无 限 长 路 径 的 对 应 符号 序列 为 

E= hiriw, 
每 个 所 是 相应 弧 的 标号 , 采用 以 下 方式 归纳 地 确定 去 

从 代表 9% 的 结 点 出 发 , SHAR OMIM, 如 果 其 中 有 
一 条 通 向 非 终止 状态 L^, 则 将 另 一 条 弧 的 标号 取 为 二， 我 们 知道 
不 可 能 发 生 两 条 纺 都 通 向 的 情况 ( 见 $8.1)， 如 果 两 条 弧 都 道 
BA F rh ap ds, WR 51, 

现 设 已 经 确定 了 从 go HEERA ó HRE, 它 对 应 的 符号 序 
列 为 hto… 如 ， 并 将 这 时 所 到 达 的 终止 状态 记 为 gg， 按照 以 下 规 
则 确定 toe 以 及 相应 的 弧 ， 

1? 从 gs 出 发 的 两 条 弧 都 通 向 了 中 的 状态 这 时 要 计算 

max {t-e td, £210], 
然后 取 其 中 较 大 的 串 的 最 后 一 个 符号 为 bri. 

2” 从 更 出 发 只 有 一 条 弧 通 向 五 中 的 状态 ， KARR 
FET ESA tras, 

由 $8.1 中 的 讨论 知道 ， 不 存在 从 9 出 发 的 两 条 弧 都 通 向 非 
终止 状态 上 的 情况 ， 

这 样 我 们 就 得 到 了 所 要 的 长 度 无 限 的 路 径 ， 以 及 相应 的 无 限 
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SPP 称 此 路 径 为 极 大 路径 ， 和 根据 86.2 的 讨论 , 可 以 假定 
KS 不 含 e， 这 时 我 们 证 明 +- KS 首先 ， 从 型 为 确定 性 的 自动 
机 可 知 ， 任 何 一 个 有 限 符 号 串 sESr 对 应 于 从 go 出 发 的 一 条 完全 
确定 的 路 径 , LAL 只 有 8#7. 和 中 的 性 质 工 可 知 , 如 果 sEL, Nis 
所 对 应 的 路 径 完 全 落 在 五 中 . 将 s 与 1 作 比 较 ， HR t 的 构造 过 
程 , 可 见 sed 成 立 . 

由 于 可 到 KS 的 每 个 前 缀 为 SET)， 因 此 已 证 明了 KS<#. 
男 一 方面 ， 由 于 t+ 完全 在 了 中， 王 的 每 个 前 缀 是 和 月 动机 所 接受 的 
F. 办 此 知道 的 每 个 前 织 都 小 于 等 于 KS, BRE é< KS m. 
于 是 1 一 KS JE. 

证 明 的 最 后 部 分 是 要 证 如 上 上 述 序 列 二 蚌 终 极 周 期 序列 ， 当 
然 , 二 也 可 能 是 周期 序列 , 因为 它 可 以 看 成 是 终极 周期 序列 的 特殊 
情况 . 

写 盟 在 生成 序列 二 的 过 程 中 的 结 点 (状态 ) Sa A: 

qo s gi ur qz S ctis gi m quai 

BUT g^ e, € F. MF HARK, WEE {gho 中 必 有 重复 ， 这 
里 要 分 两 种 情况 讨论 . 

情况 1 在 {ghio 中 存在 无 限 多 个 结 点 具有 和 性质， 从 它们 绕 
发 的 两 条 弧 都 通 问 丈 中 的 状态 ， 考 虚 相应 的 (gi, to) CP XS, 
则 一 定 能 找到 j 与 也 使 

Gr 1 

其 中 了 >0. 

由 于 人 队 gs HAY Ra eB Id F PERRA, AE RN f hg 
ERRUTEA 
bass bjb jaa Dheth jga 


和 


看 
JErB ty Boo WR, fe te WRB. uc Fc RE die RR 
O=1, 1-0 X HER, 
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Ht B nf D tte 是 偶 串 ， 即 为 含 偶数 个 了 的 串 . 不 难 用 数 
学 归纳 法 证 明 , 对 每 个 >0 成 立 
Qik = diee TEL 
这 就 导致 所 要 的 结论 : 
KSS t= tret tpr ta. 
情况 2 对 于 iho FEM. Mp j>N h, 每 个 人 只 有 一 条 
弧 通 向 中 的 状态 ， 这 时 容易 直接 看 出 存在 P>, tE 


KS=t=ty si nua typ)”, 


证 明 完毕 . D 1 
现在 举 一 个 例子 ， 用 来 说 明 上 | o 6 

面 证 明 过 程 中 的 主要 步骤 . 
[例句 已 知 图 8-1 中 的 有 限 图 8-1 


由 动机 所 接受 指 语 言 是 由 某 个 揉 序列 KS 所 确定 的 , OR KS. x 
时 五 ={f9o， 91，9s3}+， 按 照 定 理 中 的 方法 ， 可 以 求 出 极 大 路 径 所 对 


应 的 序列 
£-- 101101--., 


FR] 25 Hi ET 26 ex PULSA LEE FN: 
Qo ud gı —, qd» E qı E qi E. qa e 
其 中 第 二 个 状态 gi 和 第 五 个 状态 qi 符合 在 定理 证 明 中 的 第 一 种 
情况 的 条 性 , 这样 就 得 到 
t= 1(011)". 

实际 上 容易 看 出 上 是 周期 序列 (101)"， 这 就 是 所 要 求 的 揉 序列 . 

关于 定理 了 已 知 有 两 个 证 明 方 法 .这 里 介绍 的 是 在 [35]、 
[36]j 中 的 证 法 . 在 [38] 中 完全 从 Br 等 价 类 的 分 析出 发 给 出 了 A 
一 个 证 明 ， 它 不 像 上 述 证 明 那 样 直观 , 但 在 方法 上 更 为 一 般 , 可 用 
于 解决 一 些 其 他 问题 , 这 里 从 梧 . 


$8.4 送 定理 及 其 意义 


定理 1 的 逆 定 理 也 成 立 ， 由 于 关于 周期 揉 序列 和 终极 周期 护 
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-序列 的 情况 全 然 不 同 , 我 们 将 逆 定 理 分 成 两 个 定理 来 讨论 . 

定理 2 如 果 抒 序列 KS 为 周期 序列 ， 则 (KS) 为 正规 语 
A. 

定理 3 如 果 抒 序列 KS 为 终极 周期 序列 , 但 不 是 周期 序列 ， 
则 ^ (KS) iE BUB TE. 

下 面 讨论 这 两 个 定理 的 意义 . 

举 KS 一 (101)” WA. 接受 语言 2((101)") 的 有 限 自 动机 
已 在 图 8-1 中 给 出 。 从 $9 的 讨论 我 们 会 知道 , 这 即 是 接受 
2 (101) ”的 最 小 确定 性 有 限 自动 机 . 

设 f 了 是 以 (101)” 为 揉 序 列 的 一 个 单 峰 映 射 . 引用 $ 6.3 的 定 
382, 我 们 知道 存在 以 (101)” 为 踪迹 的 周期 3 轨 ， 根 据 沙 可 夫 斯 
基 定 理 或 李 - 约 克 定理 ( 见 [19].[18])， 章 峰 缺 射 了 具有 任何 周期 
HPL. 这 个 事实 也 可 以 用 下 面 的 方法 直接 得 到 : 26 S9 ur 07, 
i*.(10)? 和 (107 ”mm>8) 都 是 满足 86.1 条 件 的 多 许字 ,然后 
再 用 86.3 的 定理 2 知道 存在 相应 的 记 有 周期 雏 ， 这 些 允 许字 也 
很 容易 从 图 8-1 的 有 限 自 动机 中 直接 找到 . 实际 上 , 还 存在 许多 
其 他 的 周期 轨 ， 

从 [的 ] 我 们 知道 , 除了 上 述 周 期 轨 之 外 , 还 出 现 复 杂 的 混沌 行 
为 ， 即 所 谓 在 李 -约克 意义 下 的 混沌 (参见 {22] 、[24] 等 )， 这 类 动 
力学 行为 在 图 8-1 的 自动 机 中 也 有 反映 .。 实际 上 , 这 里 的 自动 机 
的 主要 部 分 与 [18] 中 的 几何 证 明 方 法 所 用 的 图 是 非常 相似 的 ， 虽 
然 它 们 了 的 具体 意义 并 不 一 样 . 定理 2 表明 , 从 形式 语言 的 角度 着， 
这 时 的 复杂 性 仍 是 属于 简单 的 层次 , 即 正规 语言 . 

FARKAS fe) 一 5b4(I 一 w), RAWEA AA N 
条 忻 的 其 他 单 峰 映射 , 当 揉 序列 为 周期 序列 时 , 存在 唯一 的 稳定 周 
期 轨 ， 同 时 , 除去 一 个 勤 贝 格 测度 为 零 的 集合 之 外 , 点 < 出 发 的 轨 
三 (z) 都 收敛 于 这 个 稳定 的 周期 轨 ， 这 些 结论 当然 不 能 用 形式 语 
高 工具 得 到 ， 我 们 在 这 里 研究 的 实际 上 是 以 某 个 给 定 的 移 位 工大 
字 为 揉 序列 的 所 有 单 峰 揣 射 的 共同 性 质 ， 例 如 , 在 K8= (1007 
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时 的 单 峰 映 射 可 以 有 多 手 一 个 的 稳定 周期 轨 ， 甚 至 有 无 穷 多 个 多 
定 周 期 轨 .， 这样 的 例子 不 难 找到 .但 就 符号 动力 学 行为 而 言 ， 则 
部 是 相间 的 . 

定理 3 所 讨论 的 情况 与 定理 2 完全 不 同 ， 即 所 谓 粗 粒 混沌 的 
情况 (参见 [26]).、 其 中 最 简单 的 例子 即 是 KS—107, 已 在 $7.1 
中 作 过 研究 ， 讨 论 得 最 为 透彻 的 具体 映射 是 二 次 方 跌 射 旋 中 的 满 
射 情况 , HI 


f (29 —42z(1—2), Üscr«l 
和 帐 莫 号 射 族 中 的 满 射 情况 , BB 
Qn, 当 O<a< 5 Bh 


F(sz)- 1 
2(1—2) ?Ó"z-s«lhf. 


在 图 8-3 中 作出 了 Pe) WAR. 

粗略 地 说 ， 这 时 的 轨道 行为 具有 极 大 的 多 样 
性 , 符合 关于 混沌 的 各 种 定义 。 这 方面 可 以 参见 
f24] 和 讨论 吸引 子 、 混 沌 概念 的 论文 [50]、 [81] 
等 ， 定 理 8 表明 , 从 语言 复杂 性 的 角度 来 看 , 系统 
的 符号 动力 学 行为 从 整体 上 看 仍 属于 简单 层次 , 即 正 规 诺言 . 

在 [37] 中 证 明了 , 定理 3 中 的 正规 语言 , 除了 (107) =S* 这 
个 唯一 例外 , 在 某 种 确定 的 意义 上 要 比 定理 2 中 的 正规 语言 复杂 . 
这 个 问题 将 在 本 书 第 5 章 中 讨论 , 这 里 的 差别 在 于 , 在 定理 3 中 的 
正规 语言 ， 除 色 (10") 之 外 ， 属 于 所 谓 无 限 补 语言 (Infinite 
Complement Languages), 而 在 定理 2 中 的 正规 语言 则 属于 有 限 
梓 语言 (Tinite Complement Languages), 


$8.5 文献 阐述 


关于 定理 2 和 定理 3, 在 文献 中 已 有 许多 讨论 。 在 [40] 中 , 格 
TU DL CP. Grassberger) 利 用 [53] 中 的 有 向 图 方法 指出 ， 当 
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KS 为 局 期 序列 时 ， 相 应 的 语言 为 有 限 补 语言 ， 从 而 是 正规 语言 . 
他 在 [41] 中 给 出 了 构造 有 限 自动 机 的 方法 ， 举 出 了 KS 为 周期 序 
列 和 终极 局 期 序列 时 的 最 小 自动 机 的 天 基 例 子 ， 其 中 包括 揉 序列 
为 
101", 100(101)", 1011(10)” 

的 情况 , 分 别 对 应 于 混沌 带 从 二 到 一 , 从 三 到 一 和 从 四 到 二 的 汇合 
点 1. 在 [41] 还 给 出 了 KS = 1017 和 1011(10)” 两 种 情况 的 马尔 可 
夫 划 分 . : 

类 似 的 结果 在 [48]、 (441 B d, mp 4 a. 在 [45] 中 讨论 了 
KS= (10010110) W [3] E, 作出 了 KS--100(101)" 的 有 限 H alf 
机 .在 [46] 中 作出 了 KS= 101(10)” 的 有 限 自动 机 ， 在 [47] 中 证 
HY KS 为 周期 序列 时 -9(KS) 为 正规 语言 作出 了 KS-(100)* 
的 最 小 有 限 自动 机 ， 在 [49] 中 对 KS=101" 作出 了 马尔 可 夫 划 
分 , 并 讨论 了 在 区 间 映 射 中 寻找 非 正 规 语言 的 可 能 途径 , 这 对 本 书 
下 一 章 的 讨论 起 了 重要 作用 , 

本 书 作者 和 同事 们 在 [85]、[36] 中 证 明了 本 节 的 三 个 定理 ， 
在 [37] 研 究 了 两 类 正规 语言 之 间 的 区 别 { 见 5 8.4 末 )， 在 [38] 中 
采用 Re 等 价 类 方法 对 三 个 定理 作出 新 的 证 明 ， 同 时 对 于 KSA 
周期 序列 时 的 最 小 有 限 自动 机 问题 作出 了 理论 上 的 完整 处 理 , 这 
方面 的 结论 在 [42] 中 已 经 猜测 到 了 .关于 KS 为 终极 周期 序列 时 
的 地 小 有 限 自动 机 问题 已 于 本 书写 作 期 间 得 到 解决 (139])， 


$8.6 马尔 可 夫 划 分 方法 

这 一 小 节 介 绍 在 [ 重 ] 中 关于 KS — 1000101) Hai 其 中 所 
用 的 马尔 可 夫 划 分 方法 具有 一 定 的 代表 性 . 

FF = te BU f()-bs(1—2)0m 2 HO MO AE fb Fi) 4 
时 可 以 实现 任何 单 峰 映射 的 揉 序列 (参见 [334 )， 因 此 不 妨 限 于 对 
二 在 [4 了 的 第 675 页 上 图 3 巾 关 于 KS 100 1017 的 最 小 有 限 自动 宙 有 误 ， 实 
际 上 它 的 状态 个 数 运 可 以 减少 参见 本 书 下 面 的 图 8-5 和 9， 
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某 个 二 次 方 旺 射 来 研究 KS= 100/101)", 实际 上 相应 B STE 


为 3.357…。 这 时 不 存在 稳定 周期 轨 ， 从 
临界 点 出 发 的 罗 只 能 是 直接 落 到 踪迹 为 VA 
(101)” 的 一 个 不 稳定 周期 轨 上 ， 这 样 一 
3, UL 产 (e) 只 含有 限 个 不 同 的 点 ， 它 们 将 AN 
区 间 [0, 1 划分 成 有 限 个 子 区 间 , 如 图 "a | 
8-8 所 示 ， 其 中 点 1~6 分 别 表示 点 fCe)、 L^ ob UN 
DE ZONSONZOERKUOLS EE 2 t 
点 ， 现在 用 字母 AE GdGRAT E. 图 8-3 
A - Ef*Ce), f°C0)], B= Ef*Ce), f(0)1, O= Lf*Co), el, D= (e, 
fo, E-[f e), f*(], F-Lf*QO, f(].. 这些 区 间 中 的 
-ARRE fBMTIOSIxxsxB—A4XL4N. R 
们 称 这 样 的 划分 为 马尔 可 夫 划 分 ， 

利用 马尔 可 夫 划 分 可 以 求 出 接受 语言 ZKK H R A 
机 .按照 [45] 的 方法 , 考虑 每 一 个 区 间 在 映射 了 下 的 原 象 ， 以 0 代 
表 了 的 堪 枝 , 以 工 代表 了 的 右 枝 , 写 出 


dcs D B— 8, 


25 


y D- F, 


B-c-um0pg9m-: FA 


` ~ ~ 


以 其 中 第 一 个 为 例 说 明 它 们 的 意义 ; 4 一 > 0.D RRE f ERN 

映射 下 区 间 A 的 象 是 区 间 O 和 万 的 并 ， 利用 以 上 信息 ， 作 出 图 

8 -4 的 方向 图 。 其 中 箭头 方向 与 上 面 的 表达 式 相反 ， 因 此 沿 荐 与 
0 
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箭头 相反 方向 的 路 径 代 表 动 力 系统 的 实际 演化 ， 在 [45]1 用 这 个 因 
来 研究 周期 轨 , 因此 方向 相反 也 没有 关系 . 

如 果 将 这 个 有 向 图 中 的 箭头 方向 取 反 , 再 利用 [1 中 的 方法 求 
出 最 小 确定 性 有 限 自 动机， 就 得 到 图 8-5 的 结果 . 这 与 [37] 中 的 
方法 所 得 的 结果 完全 一 样 ， 这 个 方法 将 在 第 9 节 中 介绍 . 


38.7 关于 把 序列 前 缀 的 研究 


这 里 介绍 [38] 中 的 基本 结果 . 它 给 出 了 揉 序列 与 Er 指标 之 
间 的 直接 关系 . 利用 这 个 结果 就 很 容易 证 明定 理 2 和 3.。 并 且 可 
以 对 定理 工作 出 新 的 证 明 . 

定理 生 工 =.2(KS) 为 正规 语言 的 充分 必要 条 件 且 在 KB 的 
前 级 中 至 少 有 两 个 是 Bi 等 价 的 . 

证 明 : 必要 性 是 容易 的 ， 如 L- 2 KS) HEM S, Whe 
希 尔 - 奈 罗 德 定理 , BL 等 价 类 只 有 有 限 个 , 因此 结论 显然 成 立 ， 关 
于 充分 性 , 首先 证 明 , 如 果 o yc L 是 两 个 是 , 它们 关于 KS 有 相同 
的 最 长 前 后 缀 , 那么 成 立 

cH. 

实际 上 , 记 它 们 关于 KS 的 最 长 前 后 缀 为 v, Ej asuv, y —u'v, 
然后 就 可 以 对 于 任何 串 sE8*, 建立 


oe L = yzc L, 


这 里 的 具体 细节 与 8S7.5 AS 7.7 相同 , 从 略 , 

然后 ,在 Ry 等 价 类 中 除了 [8s] 与 5 之 外 (参见 88.2)， 我 们 
可 以 证 明 , 每 一 个 等 价 类 中 至 少 含有 KS 的 一 个 非 空 前 级 . 

对 于 KS—10" 和 0” 的 和 情况， 在 [eg] 和 了 ZiR AR. 等 价 
类 , 因此 不 必 讨 论 .对 于 其 他 揉 序列 的 情况 , 由 于 [e] 中 已 吸收 了 所 
AO IR, 因此 , DR [el 7s dE [e] fl L^ 之 外 的 一 个 Ru 等 价 类 , Wu 
代表 元 2 必 会 符号 +， 利用 87.6 中 关于 前 后 级 存 在 问题 的 讨 
W, o 一 定 有 关于 KS 的 最 长 前 后 级 , WA v, 则 由 上 面 的 讨论 , 就 
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HA eR ”由 于 ww 为 KS 的 一 个 前 级 , 因此 已 得 到 所 要 证 的 结 
论 ; vE [21. 
IE K8 = gwr m, HES Tr BUR iO 
aU = pito tn nel, 

假设 定理 中 的 条 件 成 立 , 即 存在 KS 的 两 个 不 同 的 前 级 x 和 
a, 1« 4 j, Hi a9 yaf? 成 立 ， 我 们 可 以 证 明 , 对 于 ?> 工 的 每 个 
BOR eto, Ep aCO a0 at 中 的 某 一 个 是 BL 等 价 的 ， 为 
此 , 对 了 用 数学 归纳 法 . 

JoWiel-1 dm eacus 则 从 Bi 的 右 不 变性 质 ( 见 
§1.8), 有 

a? Ryo 一 > gt Raus 
MR6+1=§5, Wao? 52 R SH, Miti<j, MEAN 
题 . 
wE Siva = Sj. 则 有 
eth By ag, 2. 

由 于 aU, 不 是 KS 的 前 级 ， 利 用 87.6 XM Hi az, 关于 KS 
WEKAGS. WA o, WA <6 这 时 有 oP Rw? tei 
己 讨 论 完 毕 . 

从 上 述 论 断 对 了 成 立 而 推出 对 了 Tt 也 成 立 的 方法 与 3= 工 的 
讨论 完全 一 样 , 这 里 从 赂 . 

PRT AGE, RPA KS 的 无 穷 多 个 前 绷 最 多 分 属于 了 一 1 
^r RL SHR: | 
[eo], (29), …， [a4]. 
当然 , 这 里 不 排除 其 中 有 相等 的 可 能 . | 

由 前 面 确立 的 事实 ， 我 们 知道 除 [e] 和 工 之 外 已 没有 不 包含 
KS 的 前 缀 的 等 价 类 , 因此 Rr 的 指标 N 满足 不 等 式 : 

N<2+(j-1)=j+1, 
MN 有 限 即 推出 ZOKS)AGENB S. WEH. 
利用 定理 4 可 以 证 明定 理 2 和 3 而 不 必 利 用 马尔 可 去 划分， 
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具体 的 证 明细 节 写 在 附录 B 中 ， 在 定理 和 证 明 中 得 到 的 不 等 起 
入 六 ?+ 工 也 是 有 用 的 结果 ， 


$9 最 小 有 限 自 动机 的 构造 


本 节 取 材 于 [38] .[89], 主要 说 明 方法 , 并 举 大 量 例子 . 由 于 所 
涉及 到 的 证 明 过 程 甚 长 , 只 能 介绍 有 关 结 果 , BH. 所 需 的 知 
Wh S1 


$9.1. 构造 自动 机 的 基本 方法 


SU KS— z^ 为 例 ,来 说 明 这 个 方法 . 

在 第 1 章 介 绍 的 各 类 自动 机 中 ， 可 以 将 有 限 自动 机 看 成 是 不 
需要 存储 器 的 最 简单 的 一 类 自动 机 ， 但 实际 上 在 用 有 限 自动 机 识 
别 符 号 串 时 并 非 不 要 记忆 , 只 不 过 这 里 的 记忆 容量 为 有 限 , 可 以 用 
控制 器 的 状态 来 实现 记忆 , 而 无 需 其 他人 额外 的 存储 装置 . 

利用 附录 BH B.1 的 引 理 可 知 ， 当 KS 一 xz”， 而 且 AEP 
时 , 自动 机 需要 记 住 的 符号 串 的 长 度 不 超过 电 e 的 长 度 , 

举 个 具体 例子 。 讨论 .ZZ((101”))， 设 有 一 个 有 限 自 动机 M 
能 识别 -2°((101)"), 现在 用 M 来 识别 5* 中 的 一 个 符号 串 

— 
Wm z:-0, WERE, ij zi gj mix REC. me 
=e —1, WI FUE iE eo — 1 RET. EUR IE 21:1, e — 0, MEK 
£x.—10 一 起 记 生 、 以 上 这 些 考虑 的 理由 很 简单 ， Bo 100€ 
-F((0101)77), ing Bani M 不 记 住 已 出 现 的 10 上 串 ， 就 不 可 能 对 
£g 一 0 时 作出 不 接受 的 反应 , 同时 又 对 ss=1 作出 接受 的 反应 ， 同 
ERAH, X F muss. 1010 HA, RERE z= 10 也 就 够 
了 ， 这 样 就 可 以 得 出 图 9-106 PRU B SEL M, Æ [35]. (86) py 
FAA RTE, 对 于 及 S=a” 的 一 般 情 况 构 造 了 接受 LO WA 
限 自动 机 , 其 中 采用 了 $1.6 中 介绍 的 右 线性 语法 , 
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0 1 0 0 1 
工 1 
(i) (ii) 
图 9-1 
对 (i) 可 写 出 相应 的 右 线 性 语法 ， 令 
G=(V,8, P, so) 
其 中 
V —1so, 51, 82, Sa} 
4 SLE REF El OG) a RAS, IS = (0, 1}, 语法 规则 
P = {so —> &| Oso | 1s1, s1 8| 131, Osa, 
S2—> El ds, 53 — &| Oso | 153], 
FERH, 使 用 去 线性 语法 和 状态 转移 图 在 这 里 是 一 万 事 . 

但 以 上 得 到 的 (日 还 不 是 最 小 有 限 自动 机 实际 上 , 如 果 注 意 
到 在 输入 wzass= 101 时 只 要 记 往 如 1 就 可 以 得 到 (这) 中 所 示 的 
最 小 有 限 自 动机， 

一 般 来 说 , 可 以 用 [ 匡 中 的 算法 ， 从 接受 工 的 某 一 个 有 限 崩 动 
机 上 出 发 ， 求 出 接受 工 的 最 小 确定 性 有 限 自 动机 ， 在 这 里 介绍 一 个 
简单 命题 , 和 用 它 就 可 以 在 很 多 情况 中 从 某 一 个 状态 转移 图 出 发 ， 
进行 某 种 图 上 作业 市 得 到 最 小 肯 动 机 ， 这 里 又 利用 了 R, Sere 
与 状态 的 等 同性 . 

命题 He yes. 如 对 每 个 aE58 F caR.yo 成 立 , 那么 
gH. y, 

证 明 NER ce CS’ M Bac Aye, MR ete, Mayes 
=a’, aS, Ket cad ya 和 和 BL 的 右 不 变性 即 推出 ae Rye, 
因此 串 ce Aye KEHRT RAR RS L, 

现 观 察 %=s 的 情况 ， 如 果 4 Sy pA—-tAT L, 另 一 个 不 
RFL, Him Heel, y€L, JUB$T.41kE 2, ee aC S, qu 
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acl, (AMS 7.4 的 性 质 1, WA ye Lo yh, X5 aR, yo 
zr fü. 

根据 对 wz 和 和 ws 的 讨论 , 可 见 eRhy. 证 毕 . 

现在 利用 在 有 溉 自动 宙 讨 论 中 的 一 个 基本 方法 ， 即 将 每 一 个 
状态 (或 结 点 ) 与 输入 符 导 捉 的 一 个 集合 等 同 起 来 ， 这 个 集合 即 基 
从 初 态 到 该 状态 的 所 有 可 能 输入 串 所 构成 的 ， 它 在 Br 的 一 个 等 
MRE., 这样 就 可 以 在 状态 转 称 图 上 应 用 上 面 这 个 看 起 来 似乎 有 
些 抽象 的 命题 

举例 来 说 , 在 图 9 -Ti 中 ,与 S 和 ss 对 应 的 两 个 结 点 , TRUE 
D O RABBI sa MAARA LMR s 应 用 上 述 命 
E, 合并 中 和 ss 这 就 得 到 图 9-1(ii), 

注 有 时 仅仅 使 用 上 述 命题 还 不 是 以 使 有 限 自 动机 (的 状态 
个 数 ) 达 到 最 小 , 而 还 需要 其 他 命题 ( 见 8& 19.2)， 另 一 个 主要 问题 
E, 如 何 判 定 一 个 有 限 自动 机 已 是 最 小 ， 这 方面 可 参看 [1j， 对 于 
本 章 的 两 类 正规 语言 , 则 已 建立 了 一 般 性 的 理论 结果 , 即 以 下 的 主 
要 内 容 . . 
$9.2 周期 情况 的 最 小 自动 机 

在 正规 语言 类 中 比较 复杂 程度 时 ， 可 以 将 接受 正规 语言 的 最 
小 有 限 自 动机 的 状态 个 数 作 为 复杂 性 的 一 个 度量 ， 这 基 沃 尔 夫 坦 
AS. Wolfram) 在 研究 元 胞 自动 机 的 论文 [53] 中 首先 提出 来 的 ， 
实际 上 ， 这 记 是 将 计算 机 科学 中 的 形式 语言 等 工具 用 于 动力 系统 
研究 的 最 早 文献 . 

ik KS= 2°, 研究 接受 乡 ( 喧 ?的 最 小 有 限 自动 机 的 构造 方法 ， 

HaT 也 可 以 写成 (e2)” eo)” 83 Wide mac 
的 长 度 将 最 小 自动 机 的 状态 个 数 表示 出 来 ， 则 对 z 本身 必定 要 加 
一 定 的 限制 . 

这 里 提出 极 小 串 的 概念 . BOE oS B, Psp HB o BS HC BE 
KAR). 利用 附录 B.3 PHRALRS, 可 知 极 小 各 只 有 两 种 ， 
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l. e ARRAS, 

2, a—y, y HARAR, 

这 里 的 既 约 串 即 是 不 能 写成 较 短 品 的 重复 连接 的 意思 . 

引用 [38] 中 的 结果 , 即 有 

定理 1 dum KS-z", s HR), MARR SO DN 
St AG m LAR A C 

N= |z, c1, 
简要 说 明 一 下 证 明 的 主要 步 又 和 定理 荆 的 应 用 。 
设 lz|=m 记 
B= Tata Dn 
id s RTA 
a) = ayer, 1<¢<n, 
主要 国难 在 于 证 明 , aO oO --- a? xx n-1L SHR EAT 
都 不 是 Bi 等 价 的 , 同时 ，%=o) 则 与 它们 中 的 某 一 个 等 价 ， 然 
后 引用 8 8 的 定理 4 就 得 到 IN = (n— 1) 2-5 n4 1, 

为 了 构造 最 小 有 限 自动 机 ， 需 要 知道 oO (=) AK ES 
mW —^4- BAR RL Sw. 它 的 计算 方法 如 下 : BPR SUE 
0 串 ， 因 此 从 4 为 偶 囊 知 它 至 少 含 两 个 符号 1 去 掉 wz 的 第 一 个 
符号 1， 求 za…ao 关 于 开 B 的 最 长 前 后 级， 记 为 o?, WD «m 
n-—1, F (88) BEH eho, 

现在 可 以 直接 写 出 接受 (D SOINS R A BL 

M —(Q, S, 8, qo, F), 
JUPE Q= {gor go s doe Zah do WMA F go, qi s da) 
gq; 为 唯一 的 非 终 止 态 ,，S = 10, 1), SEK Qo S BRA Q HRB 
数 , 定义 如 下 ; 

L. Bli, 2141) ^ dr Kin- 2, 

2. 8(go, 0) — go, Xi Y 1«é«n-—2, MRSS a? € L, 
则 定义 Ig, aD = qr» UP SOE Ma 关于 KS 的 最 长 前 后 
28 HS BE, BILE Lu EL, 则 定义 Og, Fa) = d. 
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tel: D. 
S20? Qa 
12) 22: 0 M 
ES= any? Qus 
jaja: 0 1 
KS 0007 Ael Su 0 
i 
Ixi24: 0 i 0 
KS^ 0010)? lu l. 
e 6) 
K8-(0007? Abs 0 98 
1 
]ax155: 0 i Ü 
KS= 01107 1 4 
加 
o 1 ! o 
KS= (10010) 19, 8 
1 
0 1 9 
Ks- coon” 142492424 054,9 
i 1 
Ja] *6: 0 i 0 


S-00110)? ^ i22 Laar 


o iï 


E I-(100100)” 
1 e 


Q 
0 i 9 


i 
Q 


0 1 i 
xs-00015* G1Oo elea 
iu^ pr N ae 


i a 


KS (100001) ^ 


图 9-2 


8. 8(q, a, m) qu, m WE wee, KT KS lek Bu ja 58 
的 长 度 . 

4, Òl Ga- En) = Gn, 

B. 5(g,, O)=9,, 8(g,, 1) =gh, 

当然 , 也 容易 写 出 生成 (o7 EC ELTE IR A BOT MAR, 


§9.3 例子 


MT KS=2%, s ANB BST. CER 9-2 中 作出 了 |z: 从 
1 到 6 的 所 有 最 小 有 限 自 动机 ， 其 中 虽 有 少数 曾 于 以 前 各 节 中 已 
给 出 过 , 但 为 了 便于 参考 比较 , 已 列 出 在 这 里 . 

对 图 9-2 作 些 说 明 , 关于 大 终止 状态 , MS 8.1 中 的 讨论 可 见 
APE EH RAS. 此 外 ,在 图 9-2 中 的 KS—-z" Tg oj 
极 小 串 的 要 求 写 出 , 因此 将 1° 写 为 (11~), 将 (10)” 写成 (1010)”， 
将 (100)” 写成 (100100)“"， 只 有 这 样 才 能 从 串 了 的 长 度 反 映 出 接 
受 语言 人 (2”) 的 最 小 有 限 自 动机 的 状态 的 个 数 . 

对 于 状态 个 数 相同 的 最 小 有 限 自 动机 ， 我 们 可 以 利用 第 5 章 
中 的 方法 进一步 比较 它们 之 问 的 复杂 程度 . 

还 可 以 看 出 , 当 KS9-=w” 中 的 % 为 第 二 类 极 小 串 , May’, y 
为 既 约 奇 囊 时 , 相应 的 最 小 自动 机 所 具有 的 一 些 特点 ， 

这 时 容易 证 明 在 上 一 小 节 中 的 灾 一 mA2= |y, Je yu. 
KALEH, Hurin- ha T4 aUma€L BBC 
Ti) = 9. 从 而 在 状态 转移 图 中 从 gue 开始 的 quu. Qua, tt. Gazi 
FEAA gr AAA, HECPAET TRAGURII TI 
正 状 态 ， 这 表明 当 在 五 8=% 的 多 许字 中 , BRA Y y, 则 以 后 
只 能 是 9 的 重复 ， 


$9.4. 终极 周期 情况 的 最 小 自动 机 


关于 KS= 10" $ 1001101)" 的 情况 ， 已 在 57.1 M8 8.6 fe 
过 讨论 . BBMRM—MAM. 
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由 于 一 个 终极 周期 揉 序 列 在 写成 pX” 的 形式 时 ，p 利 入 的 取 
法 有 很 大 的 随意 性 , 因此 如 何 确 定 p A, 一 方面 使 KS-— par, 5 
一 方面 又 与 接受 (Kg9) 的 最 小 有 限 自 动机 有 直接 联系 ， 这 就 成 
为 这 里 的 主要 问题 . 以 下 材料 取 自 [3839]. 

WR KS 为 终极 周期 序列 ， 但 不 是 周期 序列 , 则 已 经 证 明 ，- 一 
定 存在 一 对 符号 串 p AA, 使 KS=p%”， 同时 满足 下 面 三 个 条 件 : 

1? oA BS MASS. 

2° p MARRET KS HAAR. 

9? 在 满足 条 件 1° $02? 的 前 提 下 , p 和 入 的 长 度 分 别 达 到 极 
小 . 

如 果 KS8=ph%”， 其 中 的 p MAM EAE 1? 和 2?， 则 称 此 R 
达 式 为 恰当 形式 .如 果 条 件 SO 也 满足 , 则 称 为 最 小 恰当 形式 

定理 2 设 揉 序列 KKS8=pX” 为 最 小 恰当 形式 ， 那 么 接受 
-2(K9) 的 最 小 有 限 自 动机 的 状态 个 数 为 

N — | p*| +1, 

由 于 这 个 定理 的 证 明 涉 及 到 很 多 技术 细节 , 这 里 从 赂 , 下 面具 
说 明 如 何 从 一 个 给 定 的 KS 出发 求 出 其 最 小 恰当 形式 ， 然 后 又 如 
何 构造 册 相 应 揭 最 小 有 殷 让 动机, 并 用 一 个 例子 来 说 明 ， 

首先 ， 将 KS 写成 p 和 和 都 为 最 短 的 形式 ， 这 时 p 和 和 的 最 
后 一 个 符号 一 定 不 相同 ， 否 则 还 可 以 进一步 隆 低 p 的 长 度 ， 和 的 
最 短 长 度 是 由 终极 周期 序列 的 周期 部 分 的 最 小 周期 唯一 确定 的 . 

WAT 如 一 开始 有 

KS =1011(01)”, 
其 中 p= 1011, 1-01, 最 后 一 个 符号 均 为 1, 则 可 改写 为 
KS=101(10)™. 

由 于 KS 不 是 周期 序列 ,有限 次 改写 后 一 定 可 以 达到 要 求 . 

其 次 , 在 入 鸭 奇 串 时 用 入 A A ERAT, BA 

KS= 101(1010)*. 
然后 ,检验 条 件 工 中 pp 为 奇 串 以 及 条 件 3° 是 否 满足 ， 如 不 
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满足 , 则 将 的 长 度 加 工 相应 地 改写 % 再 作 检验 , 直到 满足 为 止 ， 
例如 上 面 的 形式 中 p= 101 不 是 奇 串 , 则 改写 为 
K8-—1011(0101)*. 
这 时 入 ~0101 有 关于 KS 85/8 LJ 101, 因此 不 满足 条 件 2". 再 
改写 为 
KS=10110(1010)”, 
这 时 已 为 最 小 恰当 形式 . 
由 [39] 中 的 理论 性 讨论 ， 以 上 方法 在 有 限 次 后 一 定 可 以 达到 
Hh. 
现 说 明 如 何 利用 这 个 形式 直接 写 出 接受 (KS) 的 最 小 有 限 
自动 机 . 
设 KS=pX" 为 最 小 恰当 形式 、 在 [89] 中 已 经 证 明 。K8 的 
长 度 小 于 |p%| 的 所 有 前 级 中 的 任何 两 个 都 不 是 BL RES, E 时 
已 证 明 pARip 一 定 成 立 ， 采 用 在 $9.2 中 的 相同 方法 ， 就 可 以 作 
出 接受 (RK9) 的 一 个 有 限 自 动机 ， 这 里 知道 pA Rio 是 关键 的 
一 步 ， 在 [89] 中 的 理论 研究 保证 了 所 得 到 的 即 是 最 小 有 限 自动 
机 . 
FAL EA 
KS=10110(1010)”, 
可 知道 状态 个 数 N =10. 仿照 89.2 的 方法 ， 利 用 1011010102, 
10110, 就 可 作出 图 9-3 中 的 最 小 自动 机 。 


K8-10110(1010*^ 


关于 构造 有 限 让 动机 的 方法 可 参看 8 8.7 中 的 定理 4 
再 举 几 个 例子 。 
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[a] 2] KS=101”, 

4 p=10, A= 11, M) KS=10(11)* 已 是 最 小 恰当 形式 ， 这 时 
N-5, Wf KS- 10" 之 外 ,这 是 在 终极 周期 揉 序列 中 最 简单 的 
情况 ， 这 里 所 调 简 单 印 是 从 最 小 有 限 自 动机 的 状态 个 数 最 少 来 说 
的 ， 它 的 最 小 自动 机 如 下 图 所 示 . 


e 0 i | 0, 
XS-1003) , 
N-5 Q Qo > VA 
Ü0 
9-4. 

我 们 知道 ， 及 S 一 101” 对 应 于 二 次 方 喘 射 族 的 两 片 混沌 带 汇 
合成 一 片 时 的 情况 .这 时 指 系 统 除 不 动 点 外 只 有 偶 周 期 轨 . 这 在 图 
9-4 上 也 是 很 明显 的 ， 以 101° REI PI o E T UI LR e 
种 不 同 特征 ， 但 只 具有 侦 周 期 轨 则 是 它们 共有 的 性 质 ，、 利 用 图 
9-4 Al § 6.3 的 定理 , 我 们 从 抒 序 列 出 发 直接 导出 了 这 个 一 般 性 绪 
| 

[#8] KS-100(101)*, XER KS 已 为 最 小 俗 当 形式 ， 
N —'I, 见 图 8-5. 它 对 应 了 混沌 带 从 三 片 汇合 成 一 片 的 激 变 情况 . 

[ 例 4] KS8-10(0101)" W5 m KS=100(1010)", 则 为 恰 
当 形 式 而 不 是 最 小 恰当 形式 . 它 的 最 小 自动 机 如 下 图 所 示 , 六 =7. 


0 1 0 
e VD AZ > 
KS8-10€0101)99 1 
N=7 
图 9-5 


$9.5 * 合 成 律 与 广义 合成 律 


对 二 次 方 映射 米 说 ， 每 一 个 周期 窗口 左 方 的 揉 序列 为 9 
=w", 其 中 2 为 个 茎 约 串 , 由 此 可 以 生成 * ARE ETARA 
符号 变换 规则 
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h={0->2, 1> 4}, 
tip e ERR oc MG MIBRRIB BGS a. AAR 
ADBRMARAER- TAMA OPM AA DLE FECI ER 
[26]). 
在 [36] 中 考虑 了 更 一 般 的 广义 合成 律 ， 
W —10—25, 1— p}, 
它 包含 * 合成 律 为 特例 ， 且 有 多 方面 的 应 用 ， 这 里 的 符号 串 om 
% 要 满足 以 下 三 个 条 件 : 
i. p Wag, A J R; 
H. pA c 
iii. ple phle RI pr” MEHR RE PI 
”这 里 记号 pl。 和 phj 是 将 最 后 一 个 符号 改 为 6 所 得 到 的 符号 H, 
同时 这 里 对 耸 有 符号。 的 揉 序列 采取 只 写 到 c 为 止 的 有 限 记 法 . 
在 [26] 中 称 为 粗 粒 混沌 , 它 具 有 与 KS=10” 相似 的 一 系 
列 性 质 . 
利用 上 上 一 小 节 中 的 结果 , 容易 证 明 
定理 3” ne KS 是 终极 周期 揉 序列 ,但 不 是 周期 序列 ,那么 
存在 满足 广义 合成 律 要 求 的 P 和 轧 fli KS— p4", 
这 里 解释 一 下 证 明 方 法 及 其 意义 . 
(0 Ss Es 利用 在 [89] 中 关于 恰当 形式 的 存在 性, 容易 证 明 当 p 
和 和 为 恰当 形式 时 , 它们 就 满足 广义 合成 律 中 的 所 有 条 件 . 
”由 此 出 发 , 利用 广义 合成 律 , 即 可 得 到 
Lp IID (p+h)*, 
但 这 里 的 p 和 和 必须 满足 恰当 形式 中 的 条 件 ， 例 如 在 89.4 
中 的 例 就 有 
A 10110(10105*) 23(101104- 1010)*. 
但 如 将 同 -- 个 KS SH 101(10)7, 则 不 能 得 到 
-Z(101(10)*) 3(101+10)* 
前 结论 ， 实 际 上 ， 例 如 10110110 就 不 是 语言 中 的 字 ， 因 此 这 个 结 
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论 是 镇 识 的 . 

这 样 我 们 就 可 以 说 ， 每 一 个 终极 周期 反 序 列 (但 不 是 周期 序 
列 ), 就 代表 了 一 个 粗 粒 混沌 、 它 同样 导致 在 分 从 图 内 部 的 一 个 自 
相似 结构 , 只 是 在 几何 直观 上 不 如 周期 窗口 那样 明显 . 

如 果 将 周期 运动 称 为 规则 运动 ， 而 将 粗 址 混沌 看 成 为 另 一 个 
极端 , 那么 利用 形式 语言 的 工具 已 知道 , 处 于 这 两 个 极端 的 系统 的 
复杂 性 层次 都 是 最 简单 的 正规 语言 .在 第 8 节 中 的 三 个 定理 以 及 
这 一 小 节 中 的 内 容 对 于 这 个 结论 作出 了 严格 的 数学 讨论 ， 同 时 对 

于 处 于 两 端的 系统 行为 给 以 确切 的 数学 描述 . 
/ ^ 这 里 的 规则 运动 是 指 揉 序列 为 周期 序列 的 系 
统 ， 如 果 它 又 满足 施 瓦 兹 导数 为 负 的 条 件 ， 那 
么 从 几乎 处 处 的 点 出 发 的 轨 都 收敛 于 唯一 的 稳 
” E 1 定局 期 轨 . 对 于 粗 粒 混沌 情况 , 如 果 满足 一 定 的 

图 9-6 Zit, 则 存在 绝对 连续 的 遍历 不 变 测 度 , 它 反映 
出 从 几乎 处 处 的 点 出 发 的 轨 都 具有 极 强 的 随机 性质， 在 图 9-6 中 
将 上 述 讨论 用 一 条 曲线 志 示 出 来 ， O 是 对 复杂 性 的 某 种 度量 ,万 
”是 对 随机 性 的 某 种 归 一 化 度量 。 当 五 很 小 或 很 大 时 OE. X 

正 复杂 的 系统 介 于 两 个 极端 之 间 ( 参 看 [44]). 


第 4 章 


区 间 映 射 中 的 非 正 规 语言 


在 这 方面 的 研究 还 只 是 刚才 开始 ， 像 第 8.9 节 关 于 正规 语言 
那样 的 理论 还 有 待 建立 . 因此 在 这 一 章 中 主要 是 分 析 已 经 研究 过 
的 一 些 重要 例子 , 提出 一 些 有 关 的 问题 . 

在 第 10, 11 节 详 细 分 析 了 费 根 鲍 姆 吸引 子 ( Feigenbaum 
Attractor) 的 语言 及 其 复杂 性 。 在 第 12 节 将 这 个 结果 推广 到 更 
为 一 般 的 悦 周 期 分 倪 各 % 周 期 分 盆 的 极限 情况 ， 然 后 介绍 在 所 谓 
裴 波 那 净 序 列 方面 的 研究 ， 在 最 后 部 分 还 讨论 了 出 现 各 种 复杂 性 
层次 的 可 能 性 及 有 关 问 题 . 


$10 费 根 鲍 姆 爱 引 于 的 形式 语言 


本 节 介 绍 区 间 映 射 中 的 一 个 重要 情况 ， 即 们 周期 分 倪 的 极限 
情况 ， 一 般 称 为 费 根 鲍 姆 吸引 子 ， 利 用 符号 动力 学 方法 给 出 这 时 
FIERET ts。， 对 语言 也 (t。) 的 结构 作出 分 析 ， 为 在 下 一 节 对 
-Z(t) 的 复杂 性 分 析 作 好 准备 ， 本 节 材 料 主 要 来 自 丰 4]， 进 一 步 
的 推广 见 [55]. 


$ 10.1 信和 膨 期 分 全 的 极限 


为 了 理解 什么 是 费 根 鲍 姆 吸引 子 , 我 们 观察 图 10-1, EEZ 
次 方 映射 fis) = bz(1.—2) MBI E E, 其 中 0<w<1,0<6<4 
利用 微型 计算 机 很 容易 制 成 这 样 的 分 岔 图 例如 ， 对 参数 5 从 I 
开始 每 增长 0.01 计算 一 次 , HH 6—4, 对 上 述 每 个 5 TH, WH 
wo 一 0.5 FRR ARAR = 60, a. — 2,3), nz 1, 计算 轨 
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Fao) = (ao, Zis **, Dm t), 
不 妨 设 每 次 计算 到 n— 1000 Air, HP AT 100 点 弃 去 ， 而 将 其 
余 点 进 计算 边 作 图 .从 理论 上 已 经 知道 , 如 果 存 在 稳定 局 期 加 , XU 
上 述 办 将 收 全 于 它 ， 这 对 应 于 分 倪 图 上 的 低 局 斯 窗口 、 在 图 10 1 
上 上 可 以 清楚 地 看 出 的 是 周期 3 窗口 . 


4 
455 P l 
/ E 
i M 
5 TEE n 
EON | 
; UP 
il E 
P4 : : 
FÀ 
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10-1 

现在 从 5=0 开始 观察 . 当 0<8s<1 时 ， 在 分 盆 图 上 只 有 与 
b 轴 重 合 的 一 段 直 钱 ， 它 反映 出 2 一 0 为 稳定 不 动 点 的 事实 ， 从 
b= 向 右 可 以 看 到 一 条 曲线 , 它 对 应 于 稳定 不 动 点 z=1 一 b”， 直 
8j b —3 X ib. 

EK 5-3, 2 一 213 这 个 点 向 右 ， 我 们 看 到 曲线 2 一 1 一 5 发 生 
分 贫 , 变 为 两 枝 , 它们 对 应 于 一 个 稳定 周期 2 轨 的 出 现 ， 通 过 简单 
的 计算 可 知道 ， 在 5>3 时 的 不 动 点 4=14 一 87! 继续 存在 , 但 由 于 
它 不 稳定 , 在 上 述 计 算 机 实验 中 是 看 不 见 的 。 在 图 10-1 上 还 可 以 
看 到 二 分 为 四 和 四 分 为 八 的 分 岔 现象 ， 利 用 更 为 精细 的 计算 机 实 
验 和 理论 研究 可 以 知道 ， 这 样 的 倍 周期 分 贫 过 程 在 参数 5 增加 时 
将 不 断 继续 下 去 ， 辐 时 与 分 倪 对 应 的 参数 值 很 快 政 化 于 一 个 极限 
信 , 记 为 !-， 对 二 次 方 映 射 f(z) 一 5 人 (一 2)，D 33 .5699456.…, 
我 们 称 bo 为 费 根 饮 姆 点 . 

关于 从 信和 周期 分 偏 中 内 表现 出 来 的 普 适 性 和 在 b= be i MRR 
射 性 质 已 有 有 大量 的 研究 。 读者 可 以 从 [20jJ~ [29] 中 找到 有 关 材 
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HH, 述 可 以 参考 [56] 玉 [59]， 这 里 上 只 指出 几 个 主要 性 质 ， 猴 射 
fix)-b.m(l-—s), O<a#<l, 
FET AAA 2 BOER, (AR TI A 9e 
界 点 0.5 Hi ABO LISTE RARER, LR PL BL Te 
icf, 其 勒 贝 格 测度 为 0, 豪 斯 道夫 维 数 ( Hausdorlf. Dimension) 
为 0.588… (GLL57) [60]). 任何 其 他 轨 或 者 在 有 限 步 后 直接 落 
到 某 一 个 所 期 为 2 的 星 的 不 稳定 周期 轨 上 ， 或 者 被 吸引 到 上 述 康 
ERE 我们 称 这 个 康 托 集 为 费 根 鲍 姆 吸引 子 . 由 于 这 是 系统 在 
这 时 的 主要 特征 ， 今 后 称 具有 这 样 的 吸引 子 的 单 峰 映射 动力 系统 
AURI STORED. 
下 面 要 确定 费 根 鲍 姆 吸引 子 的 抹 序 列 ， 


§ 10.2 EELER 5AE 


考虑 关于 单 峰 喘 射 的 重 正 化 变换 (参见 [32]，[234])， 观 察 图 
10-2， 其 中 含 丰 一 个 单 峰 喘 射 了 的 图 
象 , e 为 临界 点 ， 卫 是 在 “ 右 方 的 不 动 
点 ， 卫 是 满足 条 件 f( 户 ) = 了 (P) 的 与 UA 
卫 不 同 的 另 一 个 点 . 在 P«f*( <e | vA 
的 条 件 下 ， 在 图 中 作出 了 PEE 
LÊ, Pj] 工 的 图 象 , 它 与 对 角 线 有 两 个 
交点 ， 除 了 了 (=f?(P)) 之 外 的 另 一 
个 交点 即 是 了 的 一 个 周期 2 点 . 

可 以 看 出 ， 如 果 将 图 10-2 p ELA CP, PORA CP, PANH 
REENEN- HATE, 再 将 区 间 [ 了 P,P] 放 大 成 区 闻 [0, 1), 
则 产 的 图 象 就 成 为 与 原来 的 了 类 似 的 单 峰 上 映射 的 图 象 了 ， 在 数 
学 上 可 以 将 以 上 步 又 用 严格 的 表达 式 写 出 来 ， 这 里 从 略 ， 我 们 称 
这 样 的 变换 为 重 正 化 变换 . 

由 于 在 对 于 了 作 重 正 化 变换 后 得 到 的 仍 为 单 峰 映 射 ， 只 要 满 
足 上 面 所 说 的 条 件 , 就 可 以 下 做 同样 的 重 正 化 变换 ， 可 以 证 明 , 对 
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b- b. 时 的 二 次 方 上 映射 ， 这 个 重 正 化 变换 过 程 可 以 无 限制 地 进行 
下 去 ， 对 于 一 般 的 单 峰 映射 ， 我 们 就 称 可 以 无 限 次 进行 重 正 化 变 
换 的 达 代 映射 系统 为 费 根 饱 姆 吸引 子 . 记 这 时 的 映射 为 无 它 的 
揉 序列 为 
KS(f) 一 人 Ce 
ABjio-23[X, FHP, Pls SI[P, f(o)], 又 将 [了 P, food 
ALP, P]， 因 此 在 轨 
f'GGD = (Fle), F2(0), 7, F”), 7) 
中 , 当 mn 为 奇数 时 , 总 满足 (CO CLP, fle], RRM, RPA 
KS— A(f'(f(e))) th, ?4 n 为 奇数 时 , 总 成 立 
a,— A(f"(e)) =1, 
于 是 a-—a-a ned, 即 有 
KS(f ) = Laglaglag:++ae,-2162,1++*, 
从 图 10-2 又 可 看 出 , 在 施行 重 正 化 变换 之 后 , 单 峰 映射 f" R 
揉 序列 为 


KS( f?) 一 15040, ^", 2o, "S 
其 中 的 上 划 “ 一 ”表示 取 反 码 , 0-1, 1 一 0， 严 格 地 说 , 对 f TEE 
正 化 变换 后 所 得 的 单 峰 映 射 不 能 用 产 这 个 记号 .为 简明 起 见 , 我 
们 约定 上 面 的 了 ,包括 在 KSA) PR f 都 是 满足 在 55.1 中 条 
件 的 单 峰 映射 ， 
根据 条 件 , 对 f? 仍 可 施行 重 正 化 变换 , 因此 根据 馈 样 理由 , 在 
KS( 户 ) 中 的 所 有 奇数 位 也 都 等 于 二 即 有 


Ga = dg — *** = 03 44x 7 7*7 =D, k=O, 
KS(f?) — 184185142, 
RM KS(f* = wams- B] F th 


于 是 得 到 


B= Og = = Beyer 1, ko, 

用 数学 归纳 法 不 难 求 出 KSS) 一 qta…a… 的 每 一 项 的 表达 式 为 
n. HELEGE 
0, 当天 为 奇数 时 ， 
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其 中 n=O, 

由 此 可 见 , 从 子 可 以 无 限 多 次 实施 重 正 化 变换 出 发 ， 了 的 邱 序 
列 是 唯一 确定 的 .今后 记 这 个 揉 序列 为 

Í. = 01627 ** 77, 

其 中 的 & 由 上 述 公式 给 忠 . 

下 面 采用 另 一 种 方法 来 研究 上 述 序列 

HT 产 与 了 一 样 , 可 以 无 限 多 次 实施 重 正 化 变换 ， 因 此 从 上 
于 的 唯一 性 就 知道 有 

K8(f) = K8(f^, 


或 者 写成 Suh Sent. de 
15134166145: 125, = G20 4o A", 
出 此 可 以 看 出 , SUE ;E X Fia 
h-— (0-11, 1-10), 
那么 就 得 到 Alat) = lala, 即 是 
hlt) = tee, 
这 里 的 同 态 映 射 概念 在 $1.9 和 3 4.2 中 已 经 引进 ， 按照 及 的 定 
X, hle) =e, 以 及 对 S" 中 的 任何 串 æy, > hog) — h eh, 就 
可 以 将 产 应 用 到 任何 有 眼 符 号 串 或 无 限 符号 种 上 去 . 
现在 从 符号 1 出 发 , 定义 
to=1, #1 一 有 h(t,)) nz, 
BRB DIF} 0 Xp c KBE 2", RRL RON 
is — 1, i = 10, 
&—1011,  t3—10211010, 
mai, ip 5 5, FU US HHPSOR S, MAARATA AA 
的 符号 串 , 那么 用 数学 归纳 法 可 以 建立 以 下 关系 : 
a TON = ftis 
(DD) = (0) =#,, n>0, 
Hep HL XEHEE w, 有 hw) = o, 
从 关系 式 aa tt, (AE nz0 8T, MEM $770 i AE t 
| 2i 


为 曾 绥 ， 因 此 在 按 位 收 化 意义 上 可 以 得 到 
t= Jinn tn, 
Rie to =A (1). REPERA DOR te ELH VLDE AT 6, 29. Ri 23 d 
一 个 无 限 符 号 忠 . 
应 用 在 $4.1 中 的 DOL RH, {ito 即 是 由 DOL 系统 
G — (10, 1}, 10—11, 1-10}, 1) 
生成 的 DOL 语言， 可 以 将 io KA DOL 序列 ， 而 i 即 是 这 
A> FF 3l SAR BR 


§10.3 tw 5 TM 序列 


ATWAA L (to) WHR to MEHER A, EX 
里 先 研究 t 的 性 质 . 

容易 证 明 t 不 是 周期 序列 或 终极 周期 序列 .实际 上 , MARAT 
将 它 写成 

b, 
其 中 |z| —pz1, Ruf pL df p 以 唯一 的 方式 写 为 
p —2"(2n-- 1), 
JUp m An EEN. NU b KSK, W kam, ANE 
2::2n.-1) > |y]. 
我 们 观察 在 fo = Gaga n EJ XR 
Uox2.41) ÈJ Azen), 

由 于 它们 的 下 标 之 差 为 2 的 倍数 , 义 都 在 1. 一 yx” 的 周期 后 缀 中 ， 
因此 应 当 相 等 , 但 另 一 方面 , MS 10.2 中 的 公式 可 见 , 这 两 个 符号 
一 定 是 不 相等 的 , 由 此 引出 了 矛盾. 

AJH 88.9 的 定理 I， 就 知道 费 根 鲍 姆 吸引 子 的 形式 语言 
了 Y(t ) 不 会 是 正规 语言 。 在 [54] 之 前 ， 这 一 点 已 为 许多 作者 猜测 
过 , [44], [48] 、[49] 等 等 . 

在 [54] 中 指出 ， 在 中 椒 出 现 接连 的 四 个 符号 1， 也 不 出 现 
ta EMF eR, n0, 代 埠 在 [54] 中 的 直接 证 明 ， 我 们 介绍 在 如 
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H SKARET- vl (Thue Morse Sequence) Z fi] iy fx 25, 
并 出 之 可 得 到 更 强 的 结论 . 
对 于 一 {0, 1}, ELAS 
g={0>01, 1—10}, 

EHA s0 一 0 出 发 定义 Sra =g (Sn), 02-0, XE RT LA 19 39 FF FI 
{s,},>0。 其 中 的 前 几 个 为 

so=0, s1=01, 

$0110, —— s,—01101001, 


AO Sg s, 是 将 s, 中 每 个 符号 到 反 码 所 得 到 的 序列 , 就 可 以 建立 北 
HE FR - 
$441 77 9485, nz, 


从 而 可 以 定义 极限 
$4 = lim s,, 


PR s. YC ÀS RR PE DU, CEBE A. Thue ) 和 偶尔 斯 分 别 独 
立 发 现 的 (参见 [6 [91], [32]. (41S). Bg gf m Ax RB dk 
不 含 任何 重复 子 串 ( 即 子 忠平 方 ; 的 无 限 符号 序列 ， 英 尔 斯 则 是 为 
了 和 研究 负 山 率 昌 面 上 的 测 地 线性 态 ， 但 后 来 也 研究 了 与 图 厄 相 同 
的 问题 ( 见 [62]). 

将 一 个 在 其 中 不 出 现任 何 形 式 为 52( =2w7) 的 子 串 的 无 限 符号 
FIPA AEA g (Square Fre) FR, 同样 ， 可 定义 无 立方 串 
(Qube-Free) 序 列 . 介 于 二 者 之 间 还 有 一 种 强 无 立方 串 (Strongly 
Qube-Free) 序 列 ， 即 不 允许 出 现 尾 何 形式 为 Pa HEB, Hep e 
ER & 的 第 一 个 符号 . 

仅仅 用 两 个 符号 不 能 构造 出 无 平方 串 的 无 限 序 列 ， 但 是 可 以 
证 明 

定理 so 是 强 无 立方 串 的 无 限 序 列 . 

在 这 个 基础 上 , 可 以 用 三 个 符号 构造 出 无 平方 囊 的 无 限 序 列 . 
关于 这 些 内 上 容 的 详细 讨论 可 人 参看 [4] [61] [62], I ab MARE, 

HI E SU XE XE s Gt. Zi IK KR. dd de audaces, Sa 
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bebe. A b=, HUS 


| WM oa 7 0; 

bia = 

1—4,, 如 Qia = 1, 

42-0, 就 可 以 从 所 得 到 s-。 利 用 s 为 强 无 立方 串 序 列 ， 就 直接 导 
出 我 们 所 和 需要 的 结果 : 


推论 i 是 无 偶 平方 串 的 序列 . 

实际 上 , 如 如 ETE s y 为 偶 串 ， 则 利用 上 述 联 系 ， 就 会 在 
Se 的 相应 处 找到 形状 为 se 的 子囊 , 其 中 & 为 的 第 一 个 符号 , 由 
此 引出 与 上 述 定理 相 矛 盾 ， 

由 这 个 推论 立即 知道 ， 在 所 PASS Tt sx E XXE TS 
了 .容易 知道 , 对 每 个 思 如 是 奇 串 , 但 如 一 (如 ) 而 如 REAR, 

在 文献 [69] 、[64] 中 已 经 指出 了 在 s- 与 如 之 间 的 联系 .此 
外 , FER SIR FES A, 序列 如 已 在 [65] [81] n XL. 

关于 图 厄 - 莫 尔 斯 序列 的 研究 和 应 用 , 还 可 参看 [66]. 


§10.4 BF L Go) tet 


对 于 非 正规 语言 ZC), 我 们 先 求 出 由 揉 序列 所 决定 的 所 有 
多 许字, 然后 就 可 以 得 到 语言 LC.) P RAR. 

在 确定 那些 是 对 许字 时 , 主要 依赖 于 下 列 的 基本 结果 . 

命题 如果 s 是 以 如 为 揉 序列 时 的 多 许字 ，s URD E> 
0) 为 前 级 , WA siue, 那么 u HO ERE 2^ C— ||) HWRAA 两 
种 可 能 : GG), v EL 6 WHR, Gi), o LL & WRT. 

这 个 命题 实际 上 完全 确定 了 人 允许 字 的 所 有 可 能 构造 ， 其 证 明 
写 在 书 末 的 附录 OH. ` 

现在 叙述 这 个 命题 的 应 用 . 

Ks 的 第 一 个 符号 开始 , 如 果 s= 0"， 它 已 是 一 个 允许 字 . 8 
Wes 中 含有 符号 1, 可 以 写成 

s = (sl, 
Hop s 从 符号 1 Hh nart 代表 在 8 之 前 的 0 BERE. AR 
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Sse VT A, 作为 s 的 后 缀 也 是 允许 字 . 对 和 如 一 用 命题 . 
如 果 在 这 个 如 之 后 仍 出 现 Zo, 则 对 这 个 如 可 以 再 用 命题 . 如 在 如 
之 后 出 现 í( - 1-0), 则 合并 toto Witt, 写成 


E [i 
g — 0*3," 


dtm ons'—sn ws Hh 再 用 命题 .这样 继续 下 去 有 以 下 三 种 可 
能 性 

G) 从 某 个 去 开始 , 每 次 应 用 命题 时 始终 只 出 现 相 辐 的 妈 而 

不 出 现 和 .这 样 就 得 到 

s= Ot HT, 
对 于 满足 施 巨 兹 导数 为 负 条 件 的 单 峰 映射 ， 这 样 的 免 许字 对 应 于 
XE 8$ 10.1 中 所 说 的 在 有 限 步 后 直接 落 到 一 个 周期 为 2 的 宕 的 不 
稳定 周期 轨 上 的 情况 、 实际 上 ， 每 个 [5| = 名， 如 本 身 也 是 允许 
字 ， 应 用 $6.8 的 定理 32， 上述 不 稳定 周期 轨 的 踪迹 就 是 好 ， 我 
们 知道 , 这 时 不 存在 任何 其 他 类 型 的 周期 轨 . 

Gi) 对 每 一 个 去 在 应 用 命题 时 , 在 有 限 次 出 现 到 之 后 一 定 会 
出 现 如 这 时 可 得 到 t-te. AN, CSPOT 
会 无 限制 地 继续 发 生 ， 这 样 就 得 到 

s= Orator. , de, 
每 个 mw 之 0， 这 也 可 记 为 乘积 形式 
s- 0J] e. 


由 于 揉 序 列 如 DAET £O BEAR, 这 样 的 允许 字 反 映 出 轨 趋 问 于 费 
根 鳃 姆 吸引 子 的 动力 学 行为 . 

(iD 从 某 个 去 开 始 ， 每 次 应 用 命 是 时 只 出 现 第 二 种 可 能 性 . 
这 样 一 来 , 利用 Ll maa, labia mie, … RERA 

8 一 Od Dt 

这 时 s 的 某 个 移 位 与 揉 序列 相等 ， 

出 于 已 知 ie 不 是 周期 序列 ， 应 用 在 8 6.5 中 的 允许 字 定 义 和 
定理 3， 可 以 不 考虑 这 类 多 许字 . 实际 上 这 类 人 允许 字 未 必 反 映 了 
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By ABER ELA Te, BS 3-3. By ne 25 fot. 

最 后 , 取 上 述 前 两 类 允许 字 的 所 有 前 织 , 就 可 以 得 到 所 要 求 的 
形式 语言 多 (各 )。 为 方便 起 见 , 引入 规范 串 的 概念 . 

称 具 有 于 列 形式 的 符号 串 为 规范 串 ， 

CHE te, 

Hepa 14-0, Ben (-1<¢<l) WERK. Jum BE 
为 0, BUR Zee Fs, quU. 设 ouzel 成 立 . 

RAAT S p) RRM & BYE for YCRU SR. 

这 样 就 可 以 写 出 

E Cio) ={tE S" ibeup(t), uM E EU m. k0}. 

实际 上 , 从 两 炎 人 允许 字 取 前 级 时 , 所 得 的 形式 是 相 则 的 .此 外 , 可 以 
Aik, 在 #=wpt(ty) 中 ,的 规范 串 形 式 中 的 7 与 如 无 关 . 


$1 复杂 性 分 析 


在 上 一 节 的 基础 上 , 用 奥 登 引 理 ( 见 8 3.4) 证 明 A CE BH E 
下 文 无 关 语 言 。 又 应 用 在 第 4 节 中 介绍 的 并 行 重 写 系统 ， 证 明 
Fite) fe ETOL HA, 从 而 也 是 上 下 文 有 关 庄 言 ， 本 节 的 材料 到 
白 [54]. 


$11.1. 关于 ita 的 一 些 性 质 

在 下 面 讨 论 中 需要 关于 序列 {} so 的 一 些 有 关 性 质 . 

在 附录 B.6 中 引进 子 关 于 一 个 有 限 符号 圳 的 循环 移 位 最 大 
Es B RES, ORR e 的 循环 移 位 最 大 囊 记 为 M (o) 

FIH i WA R, fa DARS), RRENA in WET A 
移 位 最 大 串 , 即 


还 可 以 证 明 


t,= M (ta), n=O, 
OM etg i Ca rar hes, 
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^am d Pine 


每 一 个 从 都 是 KS =i RUR 按照 86.3 的 定理 了 
它们 一 定 古 马 期 加 的 降 迹 , 容易 证 明 ie 的 最 小 周期 等 于 所 的 长 度 
To Tid, 按照 上 述 定理 ， 还 可 能 存在 最 小 周期 为 Alt) 
的 周期 轨 , 也 以 iz 为 踪迹 

同时 , EAS Hz 都 是 移 位 最 大 字 ， 因 此 都 可 以 是 某 个 音 峰 映射 
的 揉 序列 ， 这 样 就 可 以 将 上 面 的 一 系列 不 等 式 看 成 为 揉 序列 之 间 
的 关系 ， 实 际 上 , 这 反映 了 售 周期 分 岔 的 过 程 ， 重新 观察 图 10-1, 
3 Sa b 的 值 在 [0，2) 时 ， 揉 序 烈 为 0"， 当 8 Æ, 14-/ B) p 
时 ， 揉 序列 为 1"， 而 在 其 中 的 5~3 处 发 生 们 周期 分 省， 在 5=1 
+ J BB, SEARS Cle)", 3 再 增 大 时 ， 揉 序列 变 为 (10)"， 即 
具 ， 以 后 的 情况 与 此 类 似 ， 也 就 是 说 , 当 增长 到 某 个 值 之 后 , 揉 
序列 变 为 从 ， 这 时 存在 以 它 为 踪迹 的 稳定 周期 轨 ， 最 小 周期 为 
ital (一 2")， 当 参数 5 继续 增 大 到 某 个 值 之 后 , 这 个 周期 轨 变 为 不 
BE, 同时 出 现 了 周期 加 倍 的 稳定 周期 轨 ， 它 们 的 踪迹 均 为 雁 . 然 
后 当 5 值 增 大 达到 某 个 值 时 , HOLM RES nlo 在 这 之 后 出 
EUER JE tas, 

Ce PEA 0499: 95732: 12 a Dy BERYL LAB wt E 
在 , 但 都 是 不 稳定 的 ， 可 以 在 理论 上 直接 证 明 , 当 择 序列 为 如 时 ， 
不 存在 任何 踪迹 不 是 某 个 这 MANM. 而 当 抒 序列 为 从 (n>0) 
Bh, 不 存在 任何 踪迹 不 是 过, («y 的 周期 轨 、 这 个 结论 比 不 存在 
周期 不 是 2 的 筹 的 周期 轨 还 要 强 

以 上 的 一 些 事实 可 于 [24] 等 文献 中 找到 ， 也 不 难 直 接 证明， 
XB JAN. 


§11.2 Lo) X CFL 的 证 明 


现在 应 用 在 $ 3.4 介绍 的 工具 来 证 明 语言 2(f) 不 是 上 下 文 

无 关 的 ， 为 了 不 涉及 到 过 多 的 技术 细节 ， 这 里 只 对 证 明 的 主要 过 
猩 作 一 个 介绍 

从 上 一 节 关 于 多 许字 的 命题 可 以 知道 ， 如 果 在 一 个 字 zE 
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Flt) HRR- ATR o WER ZI Fi p TET A Bt, A 
册 现 会 受到 某 种 限制 .利用 在 $ 10.38 中 的 推论 , 我 们 知道 在 ti 
不 出 现任 何 22 02700 , 这 样 就 可 以 将 上 述 想 法 严格 化 , 得 到 
命题 mee L(t.), z—tyot?, pk, PA n<B, 
这 个 命题 的 证 明 并 不 困难 , 这 里 从 略 . 
现在 来 证 明 名 (tf) 不 是 上 下 文 无 关 语 言 . 
用 反 证 法 .如果 宪 (t) 是 上 上 下文 无 关 语言 , 则 由 53.4 中 的 奥 
登 引 理 , 存在 一 个 只 与 语言 有 关 的 整数 n 满足 该 引 理 中 的 要 求 . 
He k, ffi 22m RIE, 然后 取 字 
zee L(t), 
利用 关系 式 ly e fcit 可 将 * BUS 
e= t, sls, 
然后 按 引 理 中 的 规定 ， 我 们 将 “的 最 后 > 个 符 叶 的 位 置 选 定 为 
可 区 分 位 、 从 引 悍 的 叙述 可 知 ， 字 x 和 可 区 分 位 都 是 可 以 任意 取 
的 , FUE z 的 长 度 大 于 % 和 可 区 分 位 的 个 数 大 于 见 
根据 引 理 , 上 述 字 z 可 分 解 为 
E= UWY 
E RU FARE: 
1? 或 者 % Mo 均 含 可 区 分 位 , 或 者 4 My 均 含 可 区 分 位 ,二 
者 至 少 有 一 个 成 立 . 
2° w 至 少 合 一 个 可 区 分 位 , 
9? wwe 至 多 会 nn 个 可 区 分 位 . 
4? 对 每 个 0, uv'wa'yc X (1), 
可 以 证 明 , 不 可 能 存在 这 样 的 分 解 ， 
WR e+e WAT wa RAM, Mie 的 可 区 分 位 是 z 的 一 
个 后 级 , 因此 ”的 每 一 位 都 是 可 区 分 位 ， 同 时 有 |e| 委 对 于 成 立 ， 
从 条 件 4? 推出 对 每 个 30 有 mwEEL, 因 此 2 为 允许 字 ， A 
用 在 $11.1 中 关于 周期 允许 字 的 结论 ， 可 见 w 是 某 个 二 或 它 的 
SE, 其 中 pjp 二 一 4, 最 多 差 一 个 循环 移 位 ， 但 从 
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gt ty = 00d 
可 以 看 出 , 由 于 至 少 含 一 个 可 区 分 位 , T 2 的 可 区 分 位 集中 在 后 
Bhat, 因此 在 ww 这 三 个 子 串 中 ， 至 少 有 一 个 子 串 会 含有 
一 个 完整 的 子 串 不。 现在 利用 
uow y C ^ to)» 

而 其 中 的 名 可 以 任意 大 , 就 导致 与 本 小 节 的 命题 相 了 矛盾 ， 

如 果 w=s, 则 从 条 件 1^ 知道 ,这 时 & file 同时 含有 可 区 分 位 , 因 
Hlo «2*7, ff u AL. UW FUEBL ERR S ote 的 情 沉 完全 相同 ， 


$11.83. Lt.) 为 ETOL 语言 的 证 明 


利用 在 84.2 中 的 ETOL 语言 , 或 者 在 $4.5 中 的 标号 语言 ， 
都 可 以 证 明 多 (#。) 为 上 下 文 有 关 语 言 ( 参看 在 8 4.8 中 的 讨论 ). 
由 于 ETOL 语言 类 为 标号 语言 的 真子 类 , 即 有 
-J'(ETOL)& Z(IND)g.Z (08), 
我 们 在 这 里 将 证 明 Z(t) ETOL 语言 , 从 而 比较 准确 地 决定 它 
的 语言 复杂 程度 . 
AAS 10 中 关于 语言 (tu) 的 结构 分 析 , 将 它 写成 三 个 语音 
的 连接 (Concatenation) 是 比较 方便 的 
X (tea) = KKsK,, 
其 中 
五 1 一 (0"|2>>0)}， 
Ka-i(u|u DURER ete 
Ks={vlv=p(t), 1,20], 
Ki RGEBOR TO Ht OL 语言 , 当然 也 是 ETOL 语言 , Ks E 
最 主要 的 部 分 关于 规范 串 的 定义 以 及 在 K: PHS p 
W, $ 10.4, 
定义 一 个 ETOL 系统 为 
Gs(íso, T, 0, 1), A, so, 8), 
HP S={0, 1}, H - (a, ha}, 
$9 


fy = {s> 2! 8967, To T, 00, 1— 1j, 
has {Sy &, T> 1, 0— 11, 1> 10}, 
记 U (G,) 35 Ge 的 基础 系统 , 即 TOL 系统 
U (G2) = ({80, T, 0, 13, H, so). ' 
B21 由 也 (9s) 生 成 的 语言 为 
L(U(G3)) = 1T^u|u — tert: +t, n=O} 
U 1s T^uj u= Getty, n=O}, 
WEBB ” 先 证 等 号 右 方 为 左 方 的 子 集 ， 如 &%=s WALZHEA 
i T° fl sol" 属于 了 LIZ(Ga))， 在 zs 时 ， 对 1 用 数学 归纳 法 . 
4E 1-035, M 
KS So 之 Sotie b Sod "th" 3 TR 
可 见 成 立 ， 这 里 % 为 任何 非 负 整数 ， 记 号 ”表示 只 利用 如 进 
GRY, 5? 表示 具 利 用 j 进行 重 写 , 次 数 不 限 . 
现 设 对 7 已 成 立 , 考 虚 71+1 的 情况 ， 这 时 可 以 从 
So S oD pre dmn 
ot 
sito 
Mtt tel 
得 到 证 明 ， 其 中 第 一 步 的 “全 ”即使 用 在 ?了 时 已 成 立 的 妇 纳 假设 . 
现在 证 明 引 理 的 后 一 半 ， 即 如 有 ELIE(Gs))， 则 = 一定 具 
AGTEK Tru 或 T'u, Harp 820, wy RUPE EB pte. 
用 记号 50 沪 wz 表示 从 50 出发， 经 过 %' KEA K 
用 数学 归纳 法 . 
对 于 m=0 或 n=1， 这 是 平凡 的 现 设 上 述 论断 对 %' 已 成 
M, 7518 w' r3 的 情况 ， 
E nzm u, w= tet, 青 重 写 一 次 , 如 用 hio W ha) 
= {z}. JH he, 则 Ai = Deu. 
E sz = solu, 那么 有 
1u0 


Ag (2) ={T"u, sru, sy TU), 
hola) = (solos ta}, 
这 样 就 证 明了 在 重 写 oe’ +L 次 时 所 得 到 的 符号 串 仍 具有 所 说 的 形 
KR. TER, 
根据 ETOL 语言 的 定义 , 就 有 
L(G3) -L(U(G3)) NS" — Ka, 
这 样 就 已 证 明了 五 :为 ETOL 语言 . 
再 讨论 语言 肥 *。 构 造 一 个 也 OLD 系统 
G,—(1B, 0, 1}, k, B, 8), 
其 中 = (0, 1), 
h={B—>8| BI1[1B, 0— 11, 1— 10], 

HEARR Ga FRM AU (Gs)， 它 是 OL X B, 0, 
1}, A, B), 

3382. LU Gs)) —- lv| e -p(52, E20: U(vBlv-—-p(t), k 
zt. 

WEB) ”对 用 数学 归纳 法 , 可 以 证 明 右 方 为 左 方 的 子 集 . 为 了 
方便 起 见 , 我 们 证 明 更 强 一 些 的 结论 ， 即 从 B 出 发 可 以 恰好 经 过 
k KEEA pr) N P) B, 记 为 

B-—.p(t,) 与 B= yo ty) B, 

HF k=l, M amio 可 见 , EA a HAWR, PNRA LM 

s 两 种 可 能 .直接 可 以 写 出 
B> 18, B— 41, B-»,B, BS B, 

现 设 上 述 论 断 对 天 已 成 立 ， 讨 论 8+I 的 情况 。 HB 
—p(5a). Sh tuam tuis 可见 ， 如 果 风 的 长 度 小 于 | 友人 一 2 , 则 ， 
也 是 & WAAR. A BBS v, 可 见 Brat 成 立 . 如 果 le] 
= |tel, MWA E oio, v' 也 是 r 的 真 前 缀 ， 这 里 利用 了 55 
& LERKAR LAR, FMB AB= us ofi D 
=> kpt, 

RF v=p lh) BWC, 故 从 略 ， 

10) 


现在 证 明 引 理 2 的 后 一 半 ， 即 LCU(Gs)) 中 每 个 字 的 形式 不 
FE PCr), THE pli) B. BO, 

设 B, 对 m 用 数学 归纳 法 . 

H a= 这 是 平凡 的 . 现 设 结论 对 mn 已 成 立 ,讨论 ”十 工 的 情况， 

如 有 B> ,plir)， 则 再 重 写 一 次 后 的 及 (p(tx)) 明 显 为 某 一 个 
pO). 

如 有 召 全 加 (二 ) 吾 刚 可 以 计算 出 再 重 写 一 次 后 的 所 有 可 能 为 

h( ph) B) -ÍÍp9u), pu) B, b( pC) 1, h( p(t) IBY, 

IP ACp (te) ) 1 Be hoe 的 一 个 真 前 级 ,归纳 已 经 完成 .证 些 . 

根据 BOL 语言 的 定义 , 我 们 有 

L(G$) 2 L(U (G3))  S* — Ks, 

于 是 , DA Ks EOL 语言 , 当然 也 是 ETOL 语言 . 

最 后 , 利用 语言 类 .ZZ(BTOL) 对 于 连接 运算 封闭 ， 就 证 明了 
PF (to) ETOL Et zi, 从 而 也 是 标号 语言 和 上 下 文 有 关 语 言 . 


$11.4 讨 ib 


在 完成 [54] 之 后 , 我 们 看 到 了 论文 [4 和 ], 在 其 中 已 研究 了 类 似 
的 问题 .在 [4 的 中 , MEFS to 出 发 取 它 的 所 有 有 限 子 串 来 定义 
一 个 形式 语言 工 . 然后 用 关于 上 下 文 无 关 语 言 的 泵 引 理 ( 见 § 3.4) 
证 明 忆 不 是 上 下 文 无 关 语言 , 用 构造 标号 语法 的 方法 证 明 L 是 标 
号 语言 ， 因 而 也 是 上 下 文 有 关 语言 ， 这 里 的 讨论 要 容易 得 多 ， 但 
在 [4 和 中 的 语言 卫 只 反映 了 吸引 子 肖 身 中 的 符号 动力 学 行为 . 

在 [48] 中 对 于 费 根 鲍 姆 吸引 子 宣布 了 类 似 于 [44] 的 结果 ， 但 
到 目前 为 止 尚未 见 到 其 证 明 , 也 不 了 解 所 讨论 的 形式 语言 是 什么 . 

Bim 83.6 中 的 例子 对 语言 Lt.) 直接 写 出 上 下 文 有 有关 语法 
是 可 以 做 到 的 ， 但 是 证 明 将 会 变 得 相当 完 长 ， 从 84.4 中 关于 
J^ (ETOL) HP 8 98] EUR A, 它 在 上 下 文 有 关 语 言 类 LOS) p e 
复杂 程度 相对 较 低 的 一 个 子 类 ， 


此 外 ,还 应 指出 的 是 ,在 [42] 中 对 OL) OEM T — T 258 B 
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动机 , 如 图 11-1 Bp. 它 具 有 无 限 多 个 状态 ， 即 是 在 本 书 $2.1 
中 讨论 过 的 那 种 自动 机 ， 一般 而 言 ， 只 要 下 8 不 是 周期 序列 或 终 
极 周期 序列 , 应 用 88.7 中 的 定理 4， 揉 序列 KS 12537 & 7 WR 
分 属于 不 同 的 Be 等 价 类 ,应 用 在 迈 希 尔 - 奈 罗 德 定理 证 明 中 的 方 
法 , 就 可 以 构造 出 如 图 11-1 那样 的 无 限 自动 机 ， 但 是 对 于 一 般 的 
非 正 规 语 言 , 这 类 自动 机 有 可 能 具有 非常 复杂 的 结构 . 


aleve. 1 LLa 
1 0 i i 10 10 10 1 1 1 011 10 


11-1 


812 ”其 他 非 正规 语言 


本 节 先 介绍 上 一 节 的 直接 推广 ， 即 在 更 为 一 般 的 倍 周 期 分 贫 
和 匈 周期 分 岔 的 极限 情况 找到 了 新 的 非 正 规 语音 ， 然 后 介绍 由 斐 
波 那 碳 序 列 方法 所 生成 的 非 正规 语言 ， 最 后 讨论 在 单 峰 映 身 的 形 
式 语言 研究 中 有 待 解 决 的 几 个 问题 ， 材 料 来 源 为 [各] [49] 5 0$ 
未 发 表 的 工作 [55]、[67] 等 . 


$12.1 X T X 0) 的 推广 


在 [55j 中 先 研究 了 在 每 一 个 周期 窗口 中 的 信 周 期 分 盆 的 极 
R. 图 12-1 是 二 次 方 映射 fe) - be (1—2) 5 b AR ARE we OR 
bo HKA ARENE BPS RRMA TI 
是 周期 6 窗 , 它 的 左 端 对 应 于 揉 序列 (101110 六 .中 间 是 周期 扎 窗 ， 
它 的 左 端 对 应 于 揉 序列 (10111)~， 右 边 是 周期 3 窗 ， 它 的 左 端 对 
应 于 揉 序 列 (101)”. 

由 于 每 一 个 周期 窗 的 左 端 都 是 由 切 分 贫 而 形成 的 ， 因 此 容易 
知道 ， 对 应 的 抒 序 列 如 记 为 x“"， 则 c — EXER RENI), 
[26])， 当 参数 5 增 大 时 , 拌 序列 将 依次 变 为 sj。( 即 将 2 最 后 一 个 
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图 12-1 


符号 改 为 0), 2” 等 等 ， 引 进 同 态 
he— (0— a, 1 2), 
则 由 59.5 中 提 到 的 * 合成 律 可 知 ， 在 这 个 窗口 中 的 所 有 揉 序列 
从 左 到 右 的 排列 即 是 将 ko 作用 到 从 O” 到 10” 的 全 部 揉 序 烈 的 结 
X, 即 自 相 似 性 、 特 别 是 在 窗 右 端的 激 变 由 揉 序列 
A. (107) = to” 
所 刻 划 ， 对 周期 3 窗 的 激 变 见 8 8.6 的 讨论 . 

容易 看 出 , 在 每 个 周期 窗 中 的 倍 周期 分 岔 的 极限 , 可 以 由 揉 序 
列 ze 人 t) 来 刻 划 .我 们 称 对 应 的 动力 系统 为 广义 费 根 鲍 姆 吸引 子 . 

在 [外 ] PRAT, CLARE RIT MEARS 
SP (bs 1.) HABEAS (to) 相同 , 即 不 是 上 下 文 无 关 语 言 ,是 
RETOL 语 言 , 从 而 也 是 上 下 文 有 关 语 言 . 

在 [55] 中 进一步 考虑 了 mm 周期 分 岔 的 极限 点 ， 例如， 在 图 
12-1 的 周期 3 窗 中 可 以 看 到 三 个 较 小 的 图 形 ， 它 们 中 的 每 一 个 与 
二 次 方 映射 的 整个 分 贫 图 是 相似 的 .因此 在 这 三 个 小 图 形 中 各 有 
一 个 周期 3 窗 , 对 应 于 原 有 的 二 次 方 映 射 即 是 周期 9 窗 .依次 类 推 ， 
就 可 以 得 到 三 周期 分 岔 的 极限 点 ， 它 的 揉 序列 用 同 态 来 表示 同 祥 
是 非常 方便 的 . 如 像 上 面 那样 ， 记 一 个 周期 窗 对 应 的 同 态 为 to 
那么 令 
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w, - (1), nz, 

就 得 到 极限 点 的 揉 序列 为 

Wao = lima Why 
或 记 为 ae 

to. =he (1). 

对 于 语言 Xo HACE we A EY, 这 里 在 一 些 具 体 

问题 上 需要 建立 基 些 新 的 方法 ， 在 [55] 中 证 明了 -Z (w) PEE 
FRAKES, 而 是 ETOL 语言 , 从 而 也 是 上 下 文 有 关 语 言 . 


812.2 Su AE 


在 [49] 中 指出 ， 除 了 在 倍 周期 分 岔 的 极限 点 处 有 可 能 找到 非 
正规 语言 之 外 , 还 可 能 从 斐 波 那 契 序列 的 极限 来 寻找 非 正规 语言 ， 
并 作 了 大 量 的 数值 实验 ， 在 1671 中 对 此 进行 了 理论 分 析 ， 发 现 了 
大 量 的 非 正规 语言 , 并 称 相 应 的 动力 系统 为 辈 波 那 契 系统 ， 

先 举 一 个 例子 . 


AS 1B ACIES 
A-2101, 1— 10}, 


M toL RFR, A t-—A' (to), n=l, WB) — PC DOL ) FF 50 
(Goo "BSBIJLA JE 
1, 10, 101, 10110, 10110101, --- 

UD RUE BE BYE SEES 4.1, 2, 8, 5, 8, =, ARN 
Ltalano Jy ER AB STE D. 

但 这 时 的 加 不 一 定 是 循环 移 位 最 大 字 { 人 参见 附录 BO), dE 
上 面 写 出 的 第 五 个 音 就 不 是 循环 移 位 最 大 字 ， 按 照 [49j, Ht. M 
环 移 位 , 求 出 其 中 最 大 的 m= M (i), 就 可 以 得 到 极限 

m--lim m. 
它 是 移 位 最 大 字 ， 即 可 以 作为 某 个 单 峰 喘 射 的 揉 序列 ， 在 [49] 中 
用 数值 方法 求 出 了 映射 族 "> a? e, H4 m1. 714744880- «Bt 
以 mo 为 其 揉 序列 ， 这 个 映射 族 与 本 书 中 的 二 次 方 瞻 射 f) 
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=be(l—o) Sth, 上 述 参 数值 换算 成 这 里 的 b= 3.80388718---, 

除了 用 同 态 方法 外 ，[49] 中 还 使 用 了 符号 串 置 换 (Bloek 
Substitution) Fy z 3k ^: RY R BE Fe 7 GE nf LA BB [40] [69]. 

从 任意 两 个 初始 符号 囊 tot ES a, P 

ban = l2 -2i2n-1» Éni = tanton-1 

可 以 得 到 人 jso， 同 样 求 出 ma—M (5). n>0, 并 令 n— co, 就 可 
能 生成 新 的 揉 序列 . 

在 [49] 中 考虑 了 | 如 |==1 和 | 在 |=2 的 所 有 六 种 可 能 情况 ， 得 
到 四 种 不 同 的 序 烈 {m6。}so, 即 得 到 了 四 个 新 的 揉 序列 .在 表 世 .! 
中 列 出 了 这 四 个 揉 序列 在 二 次 方 映 射 中 对 应 的 参数 值 ， 与 上 面 的 
例子 一 样 ， 这 里 的 参数 慎 均 已 换算 成 在 本 书 的 二 次 方 映 射 fo 
二 bw(1 一 w) 中 的 参数 值 , 


表 12.1 
ds , b 
1 | 0 Ps 11 3. 800284948... l 
v E i i 3 a 3. 80338713- 
3 " 2 3.904142824... 
4 1 d 00 | 3.99251572-.. 


ER 世 . 革 中 的 第 二 种 情况 与 上 面 的 例子 用 同 态 得 到 的 结果 
相同 . 

在 [67] 中 研究 了 较 一 般 的 情况 Pith 为 (广义 ) 斐 波 那 
契 序 列 ， 如 果 从 给 定 的 初始 串 如 和 和 出 发 ， 按 以 下 四 种 方式 中 的 
任何 一 种 生成 序列 LN RA 

A. tng = bnaity 


B. fnt 一 加 加 +dy 


106 


O. bongo = tontontly tonsa = Pos +2t2, ga, 

D. tengo tonriton, tones = tay 415252, 
FER 12.1 PMH MAA OO. 

已 经 证 明 ， 这 四 种 方式 在 生成 抒 序 列 时 的 能 力 完 全 相同 ， 同 
时 , 不 论 如 何 取 如 Al ts, PRD ms M (in) E noo 对 一 定 收 敛 于 
某 个 移 位 最 大 字 , WRT. 

在 这 里 需要 区 别 三 类 不 同情 阅 . 

L. toh =tio MER B.3 pA +t, Hl m= MCE.) BE 
非 既 约 串 ， 揉 序列 一 定 是 周期 序列 .因此 这 时 不 会 产生 出 非 正规 
语言 . 这 相当 于 在 表 12.2 中 不 予 考虑 的 情况 : 如 =0, 五 =00 和 
io 71, 54 —11, 

2. folis hito, to Mh HHBE. Kast, ES mum M (LO 
都 是 个 串 , 今后 称 为 偶 斐 波 那 契 序列 . 

3, fofi filo, to 和 去 中 至 少 有 一 个 为 奇 串 ， 这 时 如 和 和 
一 放 ( 加 ) 的 奇偶 性 按照 两 奇 一 介 的 规律 变化 ， 今 后 称 为 奇 斐 波 那 
23), Link, 在 接连 的 三 个 串 中 总 有 两 个 奇 , 一 个 偶 . 

已 经 证 明 ， 第 2.3 类 序列 所 得 到 的 揉 序列 一 定 不 是 周期 序列 
或 终极 周期 序列 ， 因 而 就 得 到 了 新 的 非 正 规 语言 . 我 们 称 相应 的 
动力 系统 为 偶 斐 波 那 婴 系统 利 奇 斐 波 那 契 系统 . 

§12.3 关于 同 态 的 几 个 例子 

已 经 证 明 ， 斐 波 那 契 系 统 的 揉 序列 与 本 章 中 所 讨论 的 其 他 情 
况 一 样 , 都 可 以 用 同 态 的 方法 生成 , 但 这 里 可 能 涉及 到 符号 串 的 更 
一 般 的 置换 . 

以 表 12.1 中 的 四 个 情况 为 例 来 说 明 . 

[PA 1] 从 加 =0 和 到 一 革 出 发 按 方 式 O 生 成 的 揉 序列 ， 豆 
以 用 关于 两 个 符号 a 和 及 的 同 态 

h={a-aaB, B-»af) 
2), KP a-101, 8—11, A101 或 11 t1 A, PNA As 就 得 
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到 揉 序列 的 越 来 越 长 的 前 级， 其 极限 即 是 揉 序列 .这 是 偶 斐 波 那 
RAS, 而 其 他 三 个 例子 都 是 奇 斐 波 那 契 系统 . 

[ 例 引 M. 5—1$05—01(X 10) HZ, BAKO LMR Y 
A. 如 上 一 小 节 中 所 看 到 的 那样 , 也 可 以 用 同 态 {0->1, 110) 得 
到 相同 的 揉 序列 . 但 是 这 两 种 方法 都 要 求 先 作 循环 移 位 ， 再 取 
极限 .实际 上 , 在 [67] 中 证 明 , 只 要 用 同 态 

(1-»10110, 0— 110} 

WE AT LAMA LCR 0) th RERE RAR SEY. 

[BL 8] M 5015-100 01) 出 发 ， 与 例 2 类 似 ， 只 要 用 
同 态 

(1100, 0— 10100} 

就 可 直接 生成 在 表 12-2 rp DPT EZ BEP P1. 

[例句 A to=1 Al = 00 出 发 , 则 可 以 将 例 8 中 的 抒 序 列 再 
用 {1-> 1, 0-> 00} 作 用 上 去 ， 就 得 到 表 12-2 中 所 对 应 的 抒 序 列 . 
或 者 也 可 以 将 

(110000, 00 一 10010000} 

直接 用 到 符号 工 无 限 多 次 而 得 到 相同 的 结果 . 

在 以 上 四 种 情况 得 到 的 揉 序 列 关 于 相应 的 同 态 都 是 不 变 的 ， 
即 是 同 态 的 不 动 点 ， 这 对 于 一 般 情 况 世 已 证 明成 立 . 

在 表 12-2 中 写 且 了 四 个 例子 的 揉 序列 的 前 32 位 ， 只 要 再 将 
相应 的 同 态 作 用 上 去 ， 就 可 以 得 到 揉 序 列 的 任意 长 度 的 前 级 ， 对 
FAL, ELS] PBA. 


* 12.2 


i 10110, 11110, 11011, 11011, 11011, O1111, 01 


2 | 10110, 11010, 11010, 11011, 01011, 01011, 01 


3 10010, 10010, 10010, 01010, 01001, 01001, 01 


4 | 10000, 10010, 00010, 01000, 01000, 01001, 00 


§12.4 有 待 解决 的 问题 


在 这 一 小 节 中 我 们 将 对 于 单 峰 喘 射 的 形式 语言 作 一 般 性 的 讨 
ie, 并 提出 几 个 有 待 解决 的 问题 . 

以 乔 姆 斯 基 的 层次 结构 理论 来 研究 单 峰 英 射 的 形式 语言 的 复 
杂 性 问题 , 可 以 说 只 有 正规 语言 方面 的 情况 已 经 清楚 , 而 在 其 他 方 
面 的 研究 成 果 还 是 很 少 的 . 

在 [5 身 中 提出 了 一 个 猜测 , 即 在 (KS) 中 不 存在 是 上 下 文 无 
关 语 言 而 同时 不 是 正规 语 富 的 例子 ， 实 际 上 ， 费 根 饱 姆 吸引 子 的 
动力 学 行为 相对 来 说 还 是 比较 简单 的 ， 它 处 在 规则 运动 与 不 规则 
运动 的 临界 点 上 .但 从 第 11 节 的 研究 可 见 , 它 的 形式 语言 复杂 性 
已 处 在 高 于 上 下 文 无 关 语 言 的 层次 
上 ， 因 此 我 们 认为 这 个 猜测 很 可 能 是 
RLH. 

TE [48] P 3| T" RBA FR 
况 区 间 跨 射 中 的 语言 复杂 性 问题 ， 在 
非 单 值 映 射 的 情况 找到 了 上 下 文 无 关 
语言 的 例子 .图 12-2 就 是 在 [48] 中 
的 一 个 例子 .其 中 的 映射 了 由 直线 dew 

f()-(-2/2 和 fa -2»2—1 
组 成 ， 因 此 在 区 间 [0.5, 1) E, 了 不 是 单 值 的 从 [9, 0. 呈 中 的 某 
个 点 出 发 , 可 以 得 到 图 12-4 中 的 轨 ， 当 然 , 这 时 由 于 了 非 单 值 , 轨 
POAARATE 我 们 约定 当 轨 与 fi HRM RE AB A 
左 括号 “(* 来 记 , 而 当 轨 与 户 所 代表 的 线段 相遇 时 则 用 右 括号 ) 
来 记 , 这 样 就 可 以 将 轨 转 化 为 由 符号 (和 ) 组 成 的 踪迹 . 图 中 所 示 的 
BU NT ERE 
CC 30.29€ IKE HC. 26 € 22. 

由 于 轨 的 重复 部 分 在 图 上 看 不 出 来 , 因此 也 可 作 其 他 理解 , 但 括号 
的 层次 只 有 三 层 深 度 是 这 样 的 轨 记 共有 的 . 
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以 上 将 辆 转化 为 符号 申 的 方法 与 35.2 中 的 做 法 完全 一 致 . 

如 果 研 究 记 有 起 点 和 终点 重合 的 轨 所 对 应 的 符号 事 ， 则 记得 
到 的 即 是 在 访 ={(,)} 上 的 犹 克 语 言 ， 即 在 $3.2 中 介绍 过 的 上 下 
文 无 关 语 言 ， 但 它 不 是 正规 语言 . 

然而 , 由 于 通常 研究 的 区 间 映 射 均 为 单 值 映射 ， 在 这 个 意义 
上 ，[54] 中 的 猜测 仍 有 待 证 明 或 推 者 . 

接 下 来 考虑 的 是 上 下 文 有 关 话 言 类 . 从 本 章 已 经 看 到 , 大 量 的 
(KS) EF OCÉ RES, 但 不 是 上 下 文 无 关 语 言 . 利 用 在 $ 2.6 
中 的 线性 有 界 自动 机 , 容易 证 明 ， 凡 是 由 同 态 生 成 的 揉 序列 ， 相 应 
的 语言 的 复杂 层次 不 会 超过 上 下 文 有 关 语 言 类 .这 方面 的 完整 刻 
划 是 什么 还 很 不 清楚 .从 5 12.1 可 以 看 出 ， 按 一 定 的 方式 交替 使 
FABIA Ted B HA, 可 以 产生 这 个 类 中 的 大 量 实例 . 

再 高 一 个 层次 是 递归 可 枚 举 语 言 以 及 递归 语言 ( 见 $2.4 和 
$2.5). 容易 看 出 ， 如 果 对 于 “给 定 一 个 揉 序列 KS- aa a, 
这 句 话 理解 为 给 出 w 的 计算 方法 , 即 可 以 用 一 个 图 灵机 来 计算 每 
个 w 那么 语言 名 (KS) 的 复杂 性 不 会 超出 递归 语言 类 . 

但 是 还 没有 例子 ， 不 论 是 具体 的 还 是 抽象 的 ， 可 以 证 明 存 在 
-(KKS), 它 是 递归 语言 或 递归 可 枚 举 语言 , 但 却 不 是 上 下 文 有 关 
语言 . 

最 后 , 我 们 引用 在 [和 9] 中 的 结果 ， 即 证 明 存 在 (KS)， 它 的 
复杂 性 层次 为 非 递归 可 枚 举 语 言 ， 即 所 谓 不 可 计算 的 复杂 层次 . 

实际 上 , 由 于 乔 姆 斯 基层 次 中 的 所 有 语言 只 有 可 列 个 , 只 要 证 
明 (KS) Sey HY ASR, 上 述 论断 就 成 立 . 

关于 这 个 不 可 列 性 的 证 明 有 几 种 方法 ， 利用 在 $ 6.4 中 的 讨 
论 ， 只 要 证 明 存 在 不 可 列 个 不 相间 的 揉 序列 就 够 了 .利用 二 次 方 
Beat f(z) 一 bw(1 一 z) 当 8 从 0 到 生 时 拓扑 炳 为 8 的 连续 函数 ， 且 
从 值 0 单调 增加 地 达到 log 2, 我 们 就 知道 存在 不 可 列 个 不 同 的 揉 
序列 ， 或 者 我 们 也 可 以 利用 带 参 数 的 帐 棚 有 映射, (0, 1] [0, 
1], <s<2, 其 中 
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$2, Es 0<w< 时 ， 
Fe) -| AN: 
s(1—a), M El <1 时. 
利用 P. B dn du logs, 同样 推出 存在 不 可 列 个 不 同 的 揉 序列 ， 
以 上 有 关 的 材料 可 参见 [21]. 
此 外 ， 也 可 以 引用 168] 中 的 结果 ， 即 从 两 个 周期 窗 的 同 态 出 
发 ,就 可 生成 不 可 列 个 凝聚 点 , 它们 对 应 于 不 可 列 个 揉 序 列 ， 
这 样 我 们 就 看 到 , 应 用 以 上 关于 不 可 列 性 的 抽象 讨论 , 已 经 证 
明 在 划 峰 映射 的 形式 语言 .2(KS) 中 存在 着 不 可 计算 的 复杂 性 . 
当然 , 我 们 不 可 能 给 出 共有 这 样 复杂 程度 的 一 个 具体 的 择 序 列 . 因 
为 一 旦 能 够 给 定 出 这 样 的 KS, BAM EST, 2 CKS) ARTE 
层次 不 会 超过 递归 语言 类 ， 而 且 非 常 可 能 它 是 上 下 文 有 关 语 言 . 


nt 


第 5 章 


多 样 性 与 禁止 字 


本 章 研 究 语言 复杂 性 的 新 的 刻 划 方法 . 

第 一 种 方法 是 研究 语言 中 长 度 为 的 字 的 个 数 N, 4 w oo 
时 的 增长 数 s， 将 它 取 对 数 , ME A= logs, 在 8 19 中 讨论 了 
箭 的 讨 算 方 法 ， 并 且说 明 这 样 定义 的 箭 对 于 区 间 选 代 跑 射 的 动力 
AAA. 在 814 中 研究 箭 的 数值 大 小 的 动力 学 意义 , 在 
本 书 的 附录 D 中 证 明 语 襄 的 生成 函数 (0). 与 反 行 列 式 之 间 的 一 
个 重要 公式 ， 

第 二 种 方法 是 研究 在 语言 中 不 出 现 的 最 短 符号 串 ， 即 所 谓 禁 
止 字 .讨论 了 单 峰 映射 的 形式 语言 中 的 有 也 补 语言 与 无 限 补 请 
TB. 对 于 其 中 的 正规 语言 ， 得 到 了 禁止 字 的 完整 结构 、 研 究 了 禁 
业 字 集合 的 复杂 性， 以 及 它 与 原来 语言 的 关系 ， 研 究 了 非 正规 语 
言 的 禁止 字 的 具体 例子 , 提出 了 一 个 指标 . 
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AMA — ABA AS IS PS EB, Jr 
绍 它 的 基本 性 质 、 解 析 理 论 , FR SMI UE, ERA 
来 自 [21], 但 在 处 理 方 法 上 不 全 相同 ， 


$13.1 Baer 


从 第 4 章 已 经 看 到 , 对 于 大 量 存在 的 非 正规 语言 来 说 , 缺乏 有 
效 的 复杂 性 刻 划 方法 . 这 时 没有 如 8 9 中 的 最 小 有 限 自动 机 那样 
的 工具 可 以 利用 . 
i2 


本 节 对 于 诺言 中 所 含 符号 串 的 多 样 性 提出 一 种 刻 划 方法 ， 它 
来 源 于 信息 论 。 以 下 简称 为 形式 语言 的 多 样 性 (参看 [9L]~ 
[76] )， 

对 于 只 含有 限 个 符号 串 的 语言 ， 符 号 串 的 数量 就 是 语言 多 样 
性 的 最 直接 的 度量 ， 对 于 含有 无 限 多 个 符号 串 的 语言 ， 则 可 以 统 
计 在 语言 中 长 度 愉 为 ”的 符号 串 的 个 数 ON, 这 样 就 得 到 一 个 数列 
QN. 如果 这 个 语言 含 室 溃 s， 则 令 Wo=1， 曼 代 和 尔 勃 洛 
特 (B. Mandelbrot) 在 [73] 中 称 {NV} .20 29 Y FAY Bi 19 PR XX 
(Structure Funciion), 

考虑 8={0, 1} 上 的 语言 工 =S”, 则 容易 看 出 IN. 2^, nz0. 
显然 在 只 由 两 个 符号 生成 的 所 有 形式 语言 中 ， 这 个 语言 在 多 样 性 
FH CAMARA. AS 中 的 其 他 语言 则 不 ,和 2 n0. 对 
于 出 天 个 符号 生成 的 形式 语言 , 相应 地 有 不 等 式 NU" ROLL. 

现在 采取 在 [21] 等 文献 中 的 方法 ， 定 义 数 列 {Wju>o 的 增长 
数 s。 当 nn 无 限 增 长 时 , NS B TES S s^ 类似， 因此 的 数值 大 小 
反映 了 六 ,的 变化 , MERTER KEHEE. 

增长 数 的 数学 定义 是 

s lim Y/N; «lim 8, 


Xt FAG so 这 两 个 极限 必定 存在 ， 实际 上 ， 利 用 在 $7.4 
中 的 性 质 1, 如 果 将 一 个 长 度 为 十 mn WS Se 写成 
SUV, : f 
其 中 |w| =n, [ol =m RARA 
gc L > v,vcL, 
这 就 得 到 不 等 式 
Nm IN nN m. 
p b Ar, 按照 数学 分 析 中 的 标准 方法 , 就 可 以 证 明 上 述 两 个 极限 
存在 且 相 等 ， 这 样 我 们 就 知道 对 于 .多 (及 8)， 增 长 数 总 是 有 定义 
B). 由 于 在 下 一 章 中 讨论 的 形式 语言 也 具有 87.4 中 的 基本 性 质 ， 
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因此 增长 数 的 定义 也 没有 问题 . 
利用 87.4 的 性质 2, 易 见 有 
NaamN. o 《其 中 n20), 
此 外 , JOB KE sl, 因此 , 对 于 六 = (0, UL 
EE DS s 满足 不 等 式 


T<s<2. 
现在 定义 
A= log s, 
称 它 为 语言 LAM. UG ABnpeAuN 
ea 


这 里 与 本 书 其 余部 分 一 样 , 所 用 的 对 数 均 以 2 为 底 .。 

从 关于 s 的 不 等 式 得 到 关于 名 的 不 等 式 

0&he1., 

在 信息 论 中 , REA 为 信道 容量 ， 采 用 [71] 的 概念 , 我 们 将 
二 中 择 一 时 达到 最 大 程度 的 不 确定 性 取 为 信息 量 单位 ， 即 一 个 比 
特 (Bit), 这 就 是 说 , 对 于 可 能 出 现 的 符号 , 有 两 种 程度 相同 的 可 能 
性 ， 相 仿 地 , 如 果 有 种 可 能 性 , 且 可 能 程度 相同 ， 则 其 不 确定 性 
为 log 5。 我 们 也 将 不 确定 性 说 成 是 所 含 前 信息 量 . 

现在 如 果 将 形式 语言 厦 成 是 从 一 个 信 源 发 出 的 符号 串 集 合 ， 
例如 用 某 种 生成 语法 或 其 他 手段 不 断 地 生成 各 个 符号 串 并 发 送出 
de, 而 在 另 一 端 用 相应 的 自动 机 来 接受 它们 ， 那 么 上 述 箭 站 一 log s 
就 是 在 这 样 的 传输 通道 ( 即 信 道 ) 中 一 个 符号 平均 含有 的 信息 量 或 
不 确定 性 ， 因 此 , 在 这 个 意义 上 我 们 可 以 将 款 称 为 信道 容量 , 

当然 ， 这 里 没有 考 碟 各 个 符号 与 符号 串 前 实际 出 现 概率 ， 因 
此 , 提供 的 是 信道 的 最 大 可 能 容量 这 是 贝 形式 语言 工 所 完全 
确定 的 . 

在 [41], [45]、[77]、[78] 中 考虑 了 计 入 概率 因素 的 分 析 方 法 ， 
本 书 不 作 介绍 
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§13.2 X T — t UR 
E L: A Le BHESES 上 的 两 个 语言 . 将 它们 的 增长 数 
RUR AS BIG Si hi 和 So ha, 从 定义 可 见 , 如 果 有 


L,GLO(Q(cS9, 
划 成 立 不 等 式 
$1 S2, hiha. 


现在 设 L: 和 La 是 分 别 由 揉 序列 KS 和 KS, 确定 的 形 式 语 


mk 
rm 
a 


Li~ £(KS:), Ta= (Kg). 

那么 从 语言 的 定义 ( 见 $ 6.1) 直 接 看 出 , 如 果 KS KS, NJ Lic 
Lin, FAG, 增长 数 和 篇 都 是 抒 序 列 的 单调 增加 省 数 ( 严 格 地 说 是 单 
WT FEBRE. 

dE [21] FEN, 二 次 方 映射 fe) = 5z(1 一 w) 的 揉 序列 关于 参 
数 5 是 单调 增加 的 , 因此 , 如 果 将 相应 的 形式 语言 的 增长 数 和 炉 记 
为 6 的 函数 sc8) 和 有 23)， 则 它们 都 是 5 的 单调 增加 通 数 .已 经 
证 明 ， 它 们 关于 ?都 是 连续 的 。 在 图 18-1 中 作出 了 函数 (5 在 
3.2<5<4 时 的 图 象 . CH 
一 条 连续 曲线 ， 在 8< b= 
3.57) 时 与 5 轴 重 合 , 在 每 个 
周期 窗口 处 为 常数 ， 由 于 这 


些 周 期 窗 的 宽度 大 多 数 都 很 
DNE LEG Na Tae D. tk i 
期 3 窗口 对 应 的 水 平 直线 图 “13-1. 


E. 这 时 , 参数 5 的 范围 大 致 是 3.828- A) 3.857---, A= 0.694, 
关于 这 一 点 的 证 明 , X8 14.4, 
将 图 18-1 所 展示 的 多 样 性 刻 划 与 第 3.4 章 中 的 语言 复杂 性 
分 析 作 比较 ， 可 见 二 者 是 很 不 平行 的 ， 在 乔 姆 斯 基层 次 中 的 复杂 
性 是 一 个 语言 用 语法 生成 时 的 困难 程度 的 有 反映， 它 也 可 以 从 接受 
(或 识别 ) 语 言 的 自动 机 的 复杂 程度 得 到 反映 ， 这 与 语言 中 所 含 符 
IE 


号 字 的 多 少 没有 直接 关系 . 

具体 来 说 ， 上 一 章 中 详细 研究 过 的 费 根 饮 姆 吸引 子 一 般 都 认 
为 是 一 个 最 为 简单 的 准 周期 系统 ， 它 所 包含 的 周期 轨 只 有 以 
丰 (%>0) 为 踪迹 的 那些 轨 ， 即 对 每 个 2 AYRE 2 只 存在 一 种 周期 
d 再 如 上 其 他 不 动 点 ， 对 于 二 次 方 映射 , 从 图 10-1 可 以 看 到 , 费 
根 鲍 姆 点 bo 处 在 进入 混沌 的 门槛 上 ， 在 5>3。 时 出 现 了 与 5< 
b. 时 完全 不 同 的 复杂 行为 ， 在 这 一 点 上 与 图 19 二 是 一 致 的 。 在 
下 面 将 严格 证 明 , HET CLOMID E. NR LR, 
这 表明 在 极限 的 意义 上 ， 每 一 个 符 导 所 含 的 平均 信息 量 为 零 ， 实 
际 上 , TUX LOW) RAR, 这 也 是 
在 $10 中 很 容易 将 语言 0.) 的 结构 分 析 清 楚 的 一 个 根本 原 
A. ABMS 11 的 分 析 已 经 知道 ,语言 Z(t) 在 乔 姆 斯 基层 次 体 
系 中 已 属于 相当 复杂 的 上 下 文 有 关 语 言 的 范畴 . 

另 一 方面 , 从 图 18-1 则 可 知 在 第 3 章 中 所 讨论 的 所 有 正规 语 
言 ， 除 了 LUO MRO) ZS, CAB BIEN, Be de KS 
= 10" 时 , FAFA, WS 章 的 分 析 可 以 看 出 ,尽管 荣 些 语 
言 中 所 含 的 符号 囊 在 数量 上 要 比 .Z(t) 的 情况 多 得 多 , 但 语言 的 
生成 和 接受 都 属于 乔 姆 斯 基层 次 中 的 最 低层 . 

各 种 复杂 性 刻 刘 手段 之 间 的 不 平行 性 ， 是 在 复杂 性 研究 中 屡 
见 不 鲜 的 现象 , 甚至 可 以 说 , 是 必然 现象 . 反之 , 如 果 存 在 一 种 统一 
方法 可 以 将 某 一 类 系统 (或 问题 ) 完 全 刻 划 出 来 ， 甚 至 于 可 以 技 某 
个 数量 特征 将 研究 对 象 从 复杂 程度 低 到 高 线性 排列 起 来 , 那么 , 这 
类 系统 (或 问题 ) 应 当 说 不 能 算 作 很 复杂 了 ， 我 们 已 经 看 到 ， 对 于 
区 闻 映 射 ， 甚 至 是 一 个 二 次 方 肌 射 族 ， 情 况 完 全 不 是 如 此 (参见 
$7.1 中 的 讨论 ), 各 种 方法 刻 划 了 系统 的 不 同 钢 面 , 相互 之 间 往往 
是 很 不 平行 的 . 


813.3 HJ MULA UT 


:9] E TRI RING beats 它 在 下 面 很 有 用 处 . 
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人 ,是 语言 工 中 长 度 为 mm 且 从 符号 工 开 始 的 符号 串 的 个 数 , 显 
ASN, 成立 。 对 于 语言 上 一 (KS)， 存 在 更 为 确定 的 关 
系 : 

S,=N,—N,-1, naL, 
实际 上 ， WEZEL, [e| =n, AAS O 开始 , 则 可 以 记 # 一 02… 这 
REEL, |z|—-n—1. 另 一 方面 , Ae CL AEH Oz € L, 这 只 
要 利用 在 $7.5 中 的 判定 法 则 就 可 以 得 到 ， 由 此 可 见 ,在 克 , 个 长 
HEA n B5 rh [a], 从 符号 0 开始 愉 有 Noa 个 , 因此 得 到 
SaN nN pni, 

W WEB, B91 (Saher 的 增长 数 与 {入 ,so 的 增长 数 相 同 ， 
因此 , 8T MARS ahaa 计算 增长 数 s A A. 

[ 例 1] 计算 语言 工 =2(Gto) BD. 

接受 这 个 语言 的 最 小 有 限 自 动机 见 图 9 -2 的 |z[ = 4 的 第 一 个 
例子 .容易 写 出 工 的 正规 表达 式 为 

0* --0*11* 4-0*11*0 --0*11*0 (10)* -- 0*11"0(10)*1 
(559,8 1.555 [1]). 

Ier SL L RE, 并 不 需要 这 些 知识 . 

直接 计算 S, nal, BERE n2 且 以 符号 串 ILI 
BR. WEL, c—i12, He wML AR, 3XPAZCÉL mJ 
$7.6, TRRZEM. AE LP RR PAS 个， 由 此 
"DU FEL AS E 10 Fee SF SS. HB KS 
= (10), M 10 开始 的 允许 字 只 可 能 是 揉 序列 本 身 ( 参 见 附录 
C.4ff] pj 2), 这样 就 建立 起 递 推 关系 
l BS, —-S8,-1=1, n>1. 

从 Si= 工 可 见 它 的 解 为 Kanti. 这样 就 得 到 增长 数 与 炳 六 
slim Šai b=-log1-0. 
或 者 直接 从 
log 


A= lim IR 


| 


H7 


求 出 的 值 为 0. 
另 一 个 方法 是 建立 关于 { 六 .je 的 二 阶 递 推 关系 
N,—2N,-1+N,-2=1, nz. 
它 也 可 以 从 上 述 关 于 8。 的 递 推 式 导 出 这 是 一 个 二 阶 差分 方程 。 
& Nama 代入 得 到 特征 方程 为 
o? —2a+1=0, 
它 以 a=1 为 二 重 根 . YtPÉRRGRIDADBIENESCIGHURA-0, 从 No 
—1 fii N:—21H X, 可 以 解 出 


Vi SP +n+2), 


即 是 一 个 二 次 多 项 式 ， 因 此 {Nn} 当 n co 时 的 增长 速度 比 指 
数 规律 要 慢 得 多 ， 
对 于 二 次 方 喘 射 f -5s1—2), KS=(10)" 对 应 于 参数 
b 的 范围 为 (LT 5, 8.2428---). 
使 用 8 10.2 中 的 记号 , 上 述 揉 序列 即 为 c. 同样 可 以 证 明 ， 
对 一 切 56, &20, BA LP) mpi Nego, 这 时 
UN. aso 的 表达 式 都 是 多 项 式 ， 
利用 对 %>0 成 立 - 
iy «s 
其 中 to deg RC] T SEP 2I (9,8 10.2), EMA § 13.2 —FF 
始 指出 的 单调 性 质 ， 我 们 不 必 逐 个 计算 SOW, REE 
F (t) ERAT ORE T 
[D] 2] 计算 费 根 鲍 姆 吸引 子 的 炳 . 
从 EKS8-t 出 发 ， 先 计算 在 语言 L-Z tp FEA m BM 
10 开始 的 字 的 个 数 ， 与 例 1 中 的 推导 一 样 , 可 求 出 这 个 数 为 
S5, — Sgn-1, 
然后 , 利用 8 10.2 中 引入 的 同 态 
k —1(0— 11, 1— 10}, 
WAY zcLBdvAéAQGOCL RZ, mee L,|e|—-2», HA 10 
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mile DNI 


FR, MEAR TEEL. KEDR HOEKEN n HAA 
号 1 开始 的 字 , 它 由 z 唯一 确定 。 这 一 点 从 8 10.4 的 结论 来 看 是 
显然 的 ， 但 也 可 以 不 必 利 用 那 时 关于 语言 (tw) 的 结论 ， 直 接 证 
明 当 zEL 且 从 10 开始 时 ,的 每 个 奇数 位 必 是 1， 例如， 用 数学 
归纳 法 就 很 容易 证 明 这 一 点 ， 由 此 即 可 知 e MARAT OR 

这 样 就 建立 了 关系 式 

So,—San-1= Say n>i, 

这 不 是 在 通常 意义 下 的 差分 方程 ， 我 们 不 来 求 它 的 解 ， 耐 只 证 明 
成 立 , Mani d =O, 

用 反 证 法 ， 如果 上 述 极限 记 为 9 Rs>l, 则 可 以 写 出 


Jeu S, KE S n= 
4e GG) CR 
当 n— oo 时 , ZAM RMA 1—1/s>0, MTA BRN, 使 当 
n>N bt, XP AR— PRD 2/d+s)<1, 这 时 在 ”> 六 
时 , 右 方 就 小 于 


(2/(14-8))*, 
由 于 s>1, 4 n> oo 时 它 的 极限 为 0， 引 册 矛 证 


关于 以 上 两 个 例子 的 讨 沦 , 方法 与 [791 类 似 . 此 外 , RP 
计算 , 可 参看 [80] . 


§13.4 伴随 矩阵 方法 
对 于 正规 语言 , 可 以 利用 接受 它 的 最 小 有 限 自 动机 来 计算 炳 . 
这 时 的 语言 不 限于 单 峰 映 射 所 生成 的 语言 , 但 必须 是 正规 语言 . 
B L-4/(00»7)03) 8L — 从 接受 工 的 有 限 自动 机 ( 见 图 9-2) 
出 发 , 写 出 它 的 伴随 矩阵 
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X- 


OP 
O H m 
onc 


0 

0 

工 
0 O 1 0 

这 时 的 规则 是 : 将 自动 机 的 所 有 与 终止 状态 对 应 的 结 点 编号 , 如 果 

第 so 个 结 点 有 通 往 第 2 PAAR, 矩阵 下 B (6 202629 1, 8 

则 为 0， 设 自动 机 的 初 态 为 第 一 个 结 点 

WBF FEE RAM ay UL, E AX” 的 第 一 行 元 素 代表 了 从 初 态 
里 发 到 每 一 个 终止 状态 的 路 径 数 目 ， 这 里 路 径 长 度 为 mn。 由 于 所 
用 的 自动 机 是 接受 语言 工 的 最 小 确定 性 有 限 自 动机 ， 将 下" 的 第 
一 行 元 素 相 加 , 就 得 到 N,, 

可 以 证 明 ， 当 n— co 时 ， 马 " 的 第 一 行 元 素 之 和 与 下 的 最 大 
ERED n KREBS BAA. Ah, 这 个 特征 值 就 是 { 刀 ,jco 
的 增长 数 s, 

因此 只 要 计算 伴随 矩阵 的 最 大 特征 值 ， 再 取 对 数 ， 就 求 出 了 
Jii. 

UL EXE XAG, 求 出 特征 方程 为 

det(A- X) — (&—1)*(44-1), 
因此 s=1, A=O, 

在 动力 系统 中 ， 把 上 述 伴随 矩阵 叫做 斯 鞍 芬 答 阵 (Stefan 
Matrix)， 对 此 , 可 参见 [68] [26]. 计算 类 似 问 题 的 一 般 性 讨论 
X,[81], 关于 非 正规 语言 的 精 的 计算 有 很 大 困难 ， 可 参见 [75] 、 
[76]. 但 这 是 就 一 般 形 式 语言 而 说 的 。 关于 单 峰 了 映射 的 形式 语 
A MB HA AE EP STA. 


§13.5 AADESH 
BLN dono MAELA 
N(t)= BN Lt Nr No toe 
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称 为 语言 邓 的 结构 生成 函数 , 简称 为 生成 函数 、 利 用 极限 


. Ne. +: 一 了 
lim -t 一 im N, —s, 
noces noc 


BY N.N (Od — 7 SOET8 7 st BREITES X. 

对 于 语言 L- 4 KS), 可 以 从 揉 序列 KS 出 发 直接 计算 生成 
ENG). 

按照 [21], 引入 择 行 列 式 (Kneading Determinant) 

Dit) — l1-F et 8189 + + B18 Bgl eee, 
其 中 8;= e(a) (6271), a, 是 探 序列 ( 它 不 含 6) 
KS = giia eae 
中 的 第 5 个 符号 , 函数 o 的 定义 为 
a(i) =—1, &(0) — 4-1, 

ERR BIAS ARMA aE, XE [21] 中 对 于 区 
间 上 的 一 般 多 峰 映 射 建立 了 符号 动力 学 的 基本 理论 , 其 中 的 DW) 
是 从 一 个 行列 式 得 到 的 ， 因 此 称 之 为 抒 行 列 式 ， 我 们 沿用 这 个 名 


称 . 
SERRE KS = aia ae HR, SR Hi (dass 与 IT e, (n2 1), 
就 可 以 得 到 DG). 


可 以 建立 语言 工 = 必 (一 8) 的 生成 函数 立志 与 探 行列 式 
Di) Z Bm X: 
1 


NO 7 say 38794 

我 们 将 这 个 公式 的 证 明 写 在 附录 DD 中. 这 里 只 对 于 这 个 公式 作 
解释 ,在 8 14 将 举 出 大 量 例 子 . 

将 t 看 成 复 变 量 ， 由 于 DO 的 系数 都 是 土 ， pino kd 
敛 闪 径 不 小 于 1 的 解析 函数 .. 男 一 方面 , eA N QGOBEInSOER S 
s-1<<1)， 因 此 上 述 公式 在 | 直达 9 了 时 成 立 . | 

Hi T AERE EN OBS TS HUSEAI CONS YE HG, 因此 由 解析 
注 数 理论 知道 1= 8 恰好 是 六 (四 的 一 个 极点 ， 从 上 述 公 式 可 

i21 


W, DG) Elt <s RARA dup, dnsod, Miast WH 
DUTRA. 

总 结 以 上 讨论 , 对 于 语言 工 = 人 (KXS)， 可 以 从 揉 序列 KS E 
接 写 出 DG)， 然 后 计算 加 (在 区 间 [0, 1] 上 的 最 小 零点 , HER 
倒数 , 就 得 到 语言 的 增长 数 s， 同 时 得 到 焙 =log s， 在 [80] 中 有 
关于 这 类 计算 的 大 量 倘 子 . 在 [823] 中 对 误差 作 了 分 析 . 


§13.6 54e 3k Foe 


FEL — ANY rp RECTE Bah RSE IMA, 并 且 指 出 , 对 于 
ia L=.£(KS), ZAVALA SES I. 
MF KA E 89 — 82 5 RH, 这 仍然 成 立 , 可 参看 [83] ~ [85]. 

Tug CT 将 集合 了 映 入 自身 ， 将 由 迭代 生成 的 动力 系统 记 
A(X, T), 将 从 点 4%E 王 出 发 的 轨 记 为 

T'(o) = 1», 了 (op D(a), ++}, 
Bh HE RS Pe RE EE OCT T (n) WARMER es RO T 
—^A BE, "US RE JE (8b), ELTE UESTRE 
个 通俗 解释 . 

利用 符号 动力 学 方法 , REX. 作 某 种 有 限 划 分 ， 并 将 这 个 划分 
in es Hak X MAM NOTA, IF Na) A a SK 
标记 这 些 子 集 ， 那 么 就 可 以 与 85.3 中 一 样 ， 将 轨 转 化 成 符号 序 
列 ， 但 在 这 里 我 们 不 这 样 做 下 去 ， 而 是 将 划分 a 看 成 是 对 X 中 
的 点 的 一 个 测量 过 程 , 并 关心 所 能 得 到 的 信息 量 . 

对 于 点 mw 由 于 我 们 的 测量 方法 只 能 确定 到 2 展 于 入 (9) 个 子 
集中 的 哪 一 个 , 因此 按照 信息 论 , 所 含 的 信息 量 可 记 为 

H (a) —log N (a), 
这 样 的 测量 可 能 是 粗糙 的 ， 现 在 接连 测量 从 z 出 发 的 轨 上 的 
Bi n 个 点 , BP 
æ, Ta, «+, Teig, 
RT IBAE n H-T PA, RNR, MA n 
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次 测量 的 结果 ， 我 们 关于 o Ca BBL 全 "4z)) 的 不 确定 性 就 要 小 得 
多 了 . 

引进 一 点 数学 记号 是 必要 的 ， 记 了 (中 是 划分 w 在 映射 了 了 
下 的 第 名 次 原 象 , 它 阶 是 关于 集合 于 的 一 个 划分 ， 又 引入 记号 


VY Da) 
表示 将 所 有 划分 a Tia to) 合并 在 一 起 的 一 个 划分 . 
设 以 上 这 些 划分 均 为 有 限 划 分 SE 到 (oo) 的 前 m 个 点 作 测 量 ， 
得 到 长 度 为 只 的 符号 序列 ， 它 与 上 述 划分 的 某 一 个 子 集 相对 应 . 


可 以 看 出 , 当 m 无限 增 大 时 ， 划 分 VT" (o) BRE HI, X 


跨 出 我 们 得 到 越 来 越 多 的 信息 ， 在 很 多 场合 , 作为 极限 情况 , 有 可 
能 完全 确定 初始 点 o, 或 者 说 轨 了 "(wm) 本身. 
反映 动力 系统 (并 ,全 ) 行 为 的 一 个 方法 , MARE ELAM 
过 程 中 的 信息 量 .采用 与 上 面相 同 的 记号 N AH, Wien ke 
中 的 平均 信息 景 (或 不 确定 性 ) 为 
i H (Z Ta) = log V (v T-()), 


" 4=0 


4 n — co, 就 得 到 只 与 划分 a 有关 的 平均 信息 量 的 极限 , 记 为 
B(T, a) —lim( + H(I TaY). 
但 是 , HB oc 所 代表 的 测量 方法 未 必 是 最 好 的 , 因此 , 我 们 再 引进 
A(T) = sup (T, o), 

BRB DRA, TRE. 它 的 严格 定义 是 在 [85] 中 首 
先 提出 来 的 . 

由 此 可 见 ， 拓 扑 策 CT) 反 喘 了 动力 系统 (XX, T) 的 动力 学 行 
为 中 的 平均 信息 量 , 或 者 说 平均 不 确定 性 , 这 也 就 是 对 轨道 的 多 样 
性 的 一 种 可 能 度量 . 

如 果 在 集合 X 中 引进 距离 ， 对 于 子 集合 的 大 小 引进 直径 的 
概念 , 然后 定义 划分 o 的 直径 是 它 所 会 的 子 集合 的 直径 的 最 大 值 ， 
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那么 在 适当 条 件 下 可 以 证 胃 ， 如 果 当 mw co 时 ， 上 述 加 组 MA 
V T^ Ql RE RIT 0, RH 
ACT) -A(T, a), 


实际 上 这 是 拓扑 篇 的 主要 计算 方法 ， 它 具有 明 电 的 动力 学 意义 
实际 上 ， 如 果 对 胃 ZT*(z) 的 连续 观测 在 极限 意义 上 能 完全 精确 地 
确定 ox T^G) By us, 则 这 样 的 测量 方法 (或 者 说 划分 a) 就 提供 
TAA HEN fa. 

从 以 上 介绍 可 见 , ARAMA, 关于 单 诺 射 的 语言 S KS) 
在 8 13.1L 中 定义 的 炉 与 这 里 所 介绍 的 拓扑 焙 恰 好 相等 这 个 事 
实 的 证 明 见 [83] [84], Fins RAF ELS 3 [89] | [97]. 

dE [21] c xq P PE IBI. E B3 422- Bz 8C AE BER e. £g SLICES 它 是 
区 问 的 一 个 划分 o: BOXE BER EC IBI IN (o), EGRE ET IX 
BESRA 3E EL EX CGU EUN. 然后 定义 数列 CP sa 
的 增长 数 s MAM hls, 这 与 本 节 的 做 法 几乎 相同 ， 对 于 
ERN f AIG 二 32， 容易 建立 公式 

f" =2N,,-1, 
并 建立 类 似 的 其 他 联系 . 

在 荔 力 系统 研究 中 经 常 引入 拓扑 共 轧 的 概念 ， 可 以 证 明 振 扑 
AGE Hh Fhe Ga FRY AS ER. 

由 此 可 见 , 由 °C KS) S| A RE da 26S PE. 但 
3c EXC CER ER E. EE pA Ba E 
序列 , ASPEN, ERARE. 这 里 可 参看 855.4 
PAY S-A AS 7.1 中 的 图 7-l 所 提供 的 例子 ， 从 这 个 角度 看 
K, 直接 从 语言 SZ (KS) 52 MA AER EIL ARES. 

如 果 在 作 划 分 a 时 , 同时 对 oc 的 各 个 子 集 赋 以 不 同 的 权重 , 就 
可 以 自然 地 导出 测度 精 . 在 历史 上 它 的 出 现时 于 拓扑 炉 (参见 
(87)), CAEH, 拓扑 炉 是 所 有 可 能 的 测度 炉 中 最 大 的 一 个 ， 因 
此 对 入 的 计算 给 出 了 测度 炳 的 一 个 上 界 信 计 ， 又 由 于 对 于 单 峰 

Q4 


映射 来 说 , DILEIGILSI E LIA EE E 
李 雅 普 诺 去 指数 的 一 个 上 界 估计 ， 这 方面 可 参看 [88|， 


$14 。 净 的 计算 和 和 意义 


本 节 以 单 峰 映 射 的 许多 结果 说 明 ， 痪 不 仅 是 对 于 语言 中 字 的 
多 样 性 或 动力 系统 中 轨道 的 多 样 性 的 刻 刘 ， 同 时 还 直接 反映 了 动 
力 系统 的 许多 重要 性 质 ， 本 节 材料 主要 取 自 [31]， 


§ 14.1 EARRA] 65 3 


应 用 抒 行 询 式 DCE), 我 们 对 于 费 根 鲍 姆 吸引 子 的 篇 给 出 新 的 
计算 方法 ， 读 省 可 以 将 它 与 $13.3 中 的 例 2 作 比较 . 
从 揉 序列 
ta = 10111010-++ 
Re TIN 
D(t) =1-t-F 4 BA-BAS uen 
利用 在 $10.3 中 指出 的 序列 如 与 图 所 - 莫 尔 斯 序列 的 关系 ,可 以 
看 出 也 ( 娘 的 系数 恰好 是 由 符号 二 和 一 上 生成 的 图 厄 - 莫 尔 斯 序 
列 ， 这 样 就 可 以 得 到 DOW A RE A: 
D(t) = (1-8) A-At) Li), 
应 用 微 积分 中 的 判别 法 则 , 可 知 当 0<t< 工 时 这 个 无 穷 乘 积 收敛 . 
我 们 知道 ， 按 照 无 穷 乘 积 的 收敛 定义 ， 这 已 表明 DOE OKI 
时 没有 零点 ， 根 据 在 §18.5 中 的 分 析 ， 我 们 得 到 L(t.) 的 增长 
eH s=1, 84 A — 0, 
在 [21] 中 给 出 了 DC 的 上 述 无穷 乘 积 形 式 .在 [89] 中 指出 了 
它 与 图 地- 莫 尔 斯 序列 的 联系 . 
可 以 指出 , 对 于 语言 .2(t。) 来 说 , 数列 {Najs>o 的 增长 速度 超 
过 任何 多 项 式 , LAST T8 Be A A 
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§14.2 X f385 08 4E AAA 


现存 研究 当 ZA CKS) A IESUS AMMAR. H TIE 
T EET FU nj LF FOE SEP UE B VT, 根据 [83] 的 研究 , 可 以 对 任何 
揉 序列 KS theith EA (KS). 

FIFA 88 中 的 定理 1, 在 -多 (KS) 为 正规 语言 时 ，K8 不 是 周 
期 序列 就 是 终极 周期 序列 ， 统 一 这 两 种 情况 , 可 将 揉 序列 写成 

KS = mtam (05417 Gn)”, 

FE m=O 时 这 就 是 周期 序列 ， 不 妨 取 amy1…6, 为 极 小 串 ， 即 长 度 
极 小 的 偶 串 (参见 8 9.2)， 在 终极 周期 而 非 周期 序列 的 情况 , 我 们 
BOR asa. 这 时 KS 的 写法 是 唯一 确定 的 . 

E m=0 时, 按 以 上 条 件 可 以 直接 得 到 

Dt) = (1+ ertt 8:778, 4071)/ (0 — 0), 
因此 只 要 计算 多 项 式 
palt) =1-+ eat +++ + 8477-8, 327 

在 [0, 1] PR RAVES A, 

fe m>O 时, 同样 可 以 得 到 

DCE) = 1+ 83b *- 8377-84 41771-8418, (1+ Emit 

“beret Bega? a1) / (1— 170). 
因此 只 要 计算 多 项 式 
pelt) =1+ ertek er egnat A et 
十 ertt 89 12771) 

在 [0, 1] PRES AR. 

将 所 得 的 零点 记 为 sb Ws HAR EX, Th logs Hm m 
语言 OS BN. 

举 两 个 最 简单 的 例子 . 

对 于 KS= (10)7,80813.8 89] L1. 有 m=0, n—4, 计算 出 
$917 — 1, &= +1, a= —1, 就 得 到 

pmi -1—t—040—'1—0)-—27) 
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"[Uls—i, 无 一 个 

对 于 KS-107, WI m —1, n—2, 可 计算 出 

Palt) m1 — 26. 

Wi s-2, h=1, iXBDJEZE 8 13.1 PRR GAS HRS EG. 

在 [261、[68] 中 指出 , 对 于 语言 CES) RT ELA BUT A KS 出 
A, 直接 写 出 斯 蒂 基 矩阵， 而 不 必 如 $18.4 那样 利用 最 小 有 限 自 
Ht. 然后 只 要 计算 插 阵 的 最 大 正 特 征 值 就 可 以 求 出 增长 数 s. 
这 些 结果 与 上 面 所 得 的 多 项 式 pat) Mi pa(t)58 4c— S, REA 
= 1/4 MRR, - 


$14.34 5 EX 


我 们 要 证 明 , 对 于 语言 (KS9) 来 说 , Mia RAK Af EA 
多 许字 的 存在 有 密切 关系 利用 8 6.3 的 定理 2, 即 可 以 判定 原来 
的 单 妖 映射 是 否 在 在 奇 周 期 轨 ， 

先 证 明 一 个 命题 作为 准备 工作 . 

命题 设 KS=(101"3", 其 中 n% 是 大 于 2 的 奇数 ,那么 语言 
C (KS) BE A= log c, 这 时 的 是 方程 

A —34277?—1—-9 

的 《唯一 ) 正 根 . 

xc ACRES WT [52]. 

利用 $ 14.1 中 的 公式 , 直接 写 出 

plt) =1—-t—#P + — tte pt, oc 
3e UI 1+t, RA 
(1+691(t) =1—27 —?, 

FES t=1/a, TRAKS s 是 方程 入 一 2 一 一 1 一 0 的 正 根 . A 
易 验 证 这 个 方程 只 有 一 个 正 根 . 

固定 奇数 n(>2). 在 所 有 最 小 周期 为 % 的 周期 多 许字 中 ， 
(101"-*)° 具有 特殊 意义 ， 实 际 上 ， 如 对 于 某 个 去 序列 KS, FE 
Re) HAA n 的 多 许字 a, jal=n, WAE s= M (z) AL, 就 有 
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101"-«5 

成 立 ， 这 时 (100"-2)* 也 是 允许 字 . 

证 明 是 容易 的 ， 这 时 和 欧 串 名 必 从 10 开始 , 不 妨 记 为 

m= 1017:017...10"*30]1"*, . 

Ep m0, i=l, 0, b ARIE. WR <10, 则 mach; 
数 ， XAM a= M Ga), Bl “为 循环 物 位 最 大 字 ( 参 见 附录 B.D), 
可 看 出 mo m- 也 都 只 能 是 奇数 . a 

AOL tee 1017... 
TAR ww 是 偶数 . AROS EN lol ÁREA EA 引出 
WA. 

如 果 将 上 述 o7 MOO-A ERARE, MA BORA EK 
OTB f(a) = be(1— x) 84r 108 10-1(9X 12-1) b, EMA A 
PUBS a (>> 2) 8 RH Bt, 与 (101-?)” xp Be SEO ERE, 
即 对 应 的 参数 值 最小， 对 于 %w=3， 由 于 局 期 三 窗 只 有 一 个 , 这 
个 结论 是 平凡 的 . 

现在 来 介绍 本 小 节 的 主要 结果 ， 即 证 明 单 峰 有 映射 存 在 奇 周期 
PETA DE 2g PF JR 

h>log VÈ, 
这 里 的 奇 忆 期 m%>2, 即 除了 不 动 点 之 外 . 

必要 性 “ 记 揉 序列 为 KS， 如 果 存 在 奇 周 期 ”的 轨 ，n>2, 则 
从 $6.3 的 定理 2, 存在 一 个 允许 字 ©”, |z| -m B e—M(). 
利用 上 述 讨论 , 有 

(101^72)*« z"« KS 
利用 (101"-2?)” 本 身 也 可 作为 揉 序 列 看 待 , 回 时 利用 在 813.2 一 开 
始 所 说 的 炳 的 单调 性 , 就 推出 
hog w, 
其 中 心 是 方程 和 "一 2 一 1 一 0 的 (唯一 ) 正 很 .用 和 = 2 代入 
方程 左 方 得 到 一 1, 这 就 证 明了 o> VT, 
充分 性 从 s>w32 已 可 推出 揉 序列 一 定 从 符号 工 开始 ( 即 
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KKSz0”)， | 
FARE, MRR AEM AL, PRAMS 6.8 的 定理 
2, 这 时 也 不 会 存在 任何 奇 周 期 允许 字 ， 我 们 证 明 ， 这 将 导致 揉 序 
A KS 的 每 个 奇数 位 为 工 和 否则, 设 KS= aags…ai…， 目 将 第 一 个 
为 0 的 奇数 位 记 鸭 Gongs, 则 有 
KS= 10170. -01^*a;,0--., 


FOP mame EHAR RPAH, mod 成 立 。 BM KSA 
100 FF HR, 3A 10)- 即 是 一 个 奇 导 期 多 许字 .从 1007 KS Xt 
出 ani BEZZ k mi>, MM KS 为 移 位 最 大 字 将 导致 
Hj 101"*:07-101"0 FE Am WO. (RM RI, WIES 
—101"*09.-, n dh ES RA AERD), Xp 
7H. 
现在 从 KS 的 每 个 奇数 位 为 工 出 发 , 可 见 
D(i)-i—-ictÜrPacitr5ri.e 
= (1—0 (Lx Pate), 


HEERE H 4 O«i«1/42 BM D)0 [gH EX s< 
V2, WP A«logg./ 2, RH Ac log4/ 2 HFS, 

THC, SEE REESE 3 AES E CER: 
为 有 密切 联系 ， 在 二 次 方 映 射 的 分 岔 图 10-10 mpg 12-1) E a 
倒 分 又 点 ba, CERE BERE — 2 — B0 25 3: JB ABS BL e log 2, 3; 
际 上 , 这 时 的 揉 序列 KS=101", JH $ 14.2 中 的 公式 , SH 

palt) 21—t—328--205— (1—1£) (12°), 

BE ATL 49S h=log~/ 2. | 

从 上 述 结 论 可 以 知道 , REPU RK, Edm, nh 
AALS AGL, WE b> bu, 时 一 定 有 奇 周期 轨 出 现 ， 当然 , 有 
很 多 方法 可 以 得 到 这 些 结果 ， 在 这 里 强调 的 是 ， 从 揉 序列 出 发 的 
独立 证 明 与 具体 映射 无 关 ， 

上 29 


$14.4 Jg ar v wy 

MEH, 3k — XJ; WU B EE En38E— ARA B, HN 
的 值 是 不 变 的 常数 ， 

为 此 上 先知 些 淮 备 工作 . 

如 果 语 言 SORS) A SRAM 089 p] i EDS 

g—í(0-»11, 1—10}, 

WEE Lg KS) WRATS FT A/2, 这 里 的 同 态 在 $10 中 已 
多 次 使 用 ， 为 了 不 与 本 章 的 暗 指 记 号 发 生 混淆 ， 我 们 用 记号 9 来 
ERE. 

容易 证 明 ， (KS8) 中 的 每 个 字 在 g 映射 下 的 象 即 是 语言 
LKS) PASS, 长 度 如 税 ， 因 此 ， 如 果 记 六 ,是 语言 (KS) 
HER SNe, Mig NBS LO KS) PEA nhs 
的 个 数 , 那么 就 有 

N.N, 

mua. Sit 
L tog Ft I (dog N.), 


"2n 
FES ”> oo, 就 得 到 所 要 的 结论 . 
推广 上 述 结论 。 如 果 在 某 个 择 序 烈 KS 时 存在 周期 为 


一 2"p 的 轨 ,p 是 大 于 2 的 奇数 ,那么 语言 SKS) AR RA SR 


1 
AT log €», 


其 中 必 是 方程 一 2%? 习 一 1=0 的 正 根 . 这 里 利用 了 $14.3 中 的 
结论 ， 证 明 从 赂 . 
这 时 增长 数 


1 
szo”, 


由 于 已 知 o7 2 成 立 , 因此 得 到 估计 式 


grin s gris ad. 
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现在 讨论 二 次 方 映射 的 周期 窗 。 设 某 个 周期 窗 左 端的 拌 序列 
为 
K8,— 2", 
其 中 s ARAM ABM RAE. 如 在 812.1 所 说 的 那样 ， 由 
于 周期 窗 是 从 切 分 岔 生成 的 , 因此 o BAB. idle] mn, 
5 89.5(9X 8 12.1) 48 (i Hb, 定义 同 态 
g={0—>z, 1-2). 
那么 , FAH BE Aha PRP PES 
KS, —g(107) = da^, 
它 与 激 变 相对 应 , 
分 别 对 KS. 和 KS. 应 用 § 14.2 中 的 公式 , 得 到 
palt) = 1 eitt tet enen af" 7l, 
Palt) = (1+ eitt 616, a7) (1 — 28”), 
我 们 已 知 Pa(#) 的 最 小 正 零 点 为 s? 由 于 上 面 已 经 证 明了 #8> 
2", Bs *<2", Am NREL AOE s-1， 因 此 就 知道 
语言 7(KS) 5 攻 ( 有 总) 的 炳 相等 . 利用 在 [21] 中 已 经 建立 的 
结果 , BUY 2 的 单调 非 降 函数 , 我 们 就 证 明了 在 整个 周期 窗 上 篇 
为 常数 . 
这 个 结论 的 反面 也 成 立 , 其 证 明 可 参看 [89]. 
不 出 现 局 期 窗 的 一 个 典型 例子 是 帐 棚 映射 
F(a) = e 3C 0« z«0.5 时 ; 
s(1—2), M0. b a« 1H; 
HHSRs HWA MOD 2, 图 14-1 1 
是 它 的 分 岔 图 ， 在 [21] 中 证 明 , 每 一 个 
HKA s> 1 Ae) BA g BR BY Fh Fb EE BE 
FF, XE SAHs 也 是 五 ,的 增长 
数 ， 在 0<s< 工 时 不 动 点 &=0 是 稳定 
AY. XEs-impxm[O, O.5ppA A 9 
RETHA. ATP. 及 其 分 岔 图 的 讨 


it, 可 人 参看 [80] [91]. WWE, dk s>1 时 也, 的 李 雅 普 诸 夫 指 
数 = 测度 炳 = 攻 扑 确 =logs， 这 里 所 用 的 测度 是 唯一 存在 的 绝 
对 连续 亡 片 测度 . 
§14.5 d XR LZ SEX 

PLETE RA, BAER Ay ERU 767 d EZ PEE ELTE E JR BH 
Fy 2 WORE AS A HBS. , 

必要 神 实 际 上 已 经 在 上 面 的 讨论 中 得 到 ， 如 果 存 在 周期 贺 ， 
其 最 小 冰期 m% 不 是 2 的 寡 , Nl RESI n—2"p, 为 大 于 2 的 奇数 ， 
xxi] EL AURI | 

Ac» sa log €, 


cM Jj$8 25 —21971—1—0 的 正 根 ， 由 于 oc 2, BE A0, Ff 
出 矛盾 . 

充分 性 实际 上 隐 合 在 $10 的 研究 中 , 我 们 现在 用 数学 归纳 法 
TENA, 如果 存 在 周期 2 的 轨 , 但 同时 不 存在 周期 不 是 3 BREUI 
何 周期 轨 , 那么 揉 序列 必 以 霹 为 前 级 ， 这 里 的 记号 刀 在 $10.2 中 
已 定义 . 

对 于 n=1, 周期 2 的 允许 字 只 有 (10)” 或 (01)*， 因 此 抒 序 列 
KS 以 二 一 40 开始 是 明显 的 ， 

现 设 上 述 论断 对 nn 已 成 立 ， 讨 论 n 二 1 的 情况 ， 按 归纳 假设 ， 
KS M 5,2: 8028. 利用 在 8$ 10.4 中 的 结果 (或 参见 附录 O0, KS 
在 所 之 后 不 是 如 就 是 如 。 如 同时 存在 周期 为 27*t 的 轨 , 将 其 踪迹 
iy a7, |s]-9'3, HRB e-M(o), MADE ome, 
= tesa, 这 就 可 以 推出 揉 序列 一 定 是 以 各 aa A, 归纳 证 明 
已 经 完成 . 

现在 容易 解决 我 们 的 问题 ， 如 果 存 在 周期 为 2" 的 轨 , 但 不 存 
在 周期 为 991 的 轨 ， 则 由 上 可 见 KS =e ER AT 
2" (n2-0) WY Ji] BR gu, 但 不 存在 任何 基 他 周期 的 网 期 轨 , 那么 根据 上 
p32 


述 证 明 , Hy 34 KS 将 以 每 一 个 如 为 它 的 前 缓 ， 因 此 就 推出 
ES = tu 

(人 参见 8 10.8 关 于 到 的 定义 )， 在 313.3 中 已 经 证 明 ， 这 两 种 局 

DES YAR Je: O, 


$1.6 d 545] 

MJBEXJF. RNR MIR E -Z CKS) BUS E h ERY PI 
确定 的 ， 从 本 节 的 讨论 已 经 看 到 , LER HE SUB, 但 它 往 往 
反映 出 动力 系统 的 重要 动力 学 行为 ， 从 $ 14.4 对 于 周期 窗口 的 
SWI, Visi AE Bt AGAR SEE LR EN 051352 7J ABR ob 7J ^£ 
行为 处 于 那 一 个 周期 窗 中 , TET BE CUR IB BE 29 YA. 

在 这 方面 再 引 用 [21j] 中 的 一 个 结果 . 

EE AREI BR. p RT XE IE d SOR JEJE S SES Tue 
士 {==0 这 样 的 方程 的 根 ， 那 么 ， 揉 行列 式 DORE s E — $8 E 
的 . 

对 于 这 个 定理 的 应 用 还 不 很 清楚 , 但 它 说 明 , 在 一 定 条 件 下 和 类 

h 唯一 地 决定 了 揉 序列 以 及 形式 语言 本 身 . 


81 禁止 字 与 正规 语言 


如 果 说 粒 反 映 的 是 在 语言 中 允许 出 现 的 符号 串 的 多 样 性 ， 那 
入 禁止 字 则 是 从 在 语言 中 不 允许 出 现 的 符号 串 来 看 问题 ， 对 于 具 
有 57.4 中 两 个 性 质 的 语言 ， 在 本 节 中 定义 禁止 字 及 其 集合 L”. 
对 于 单 峰 映 射 中 的 两 类 正规 语言 ， 研 究 了 它们 的 禁止 字 集 合 的 不 
同 特点 ， 


§ 15.1 关于 禁止 字 的 一 般 概念 
RS 为 有 了 腿 符号 集 , LES* 是 在 SS 上 的 一 个 形式 语言 .我 们 
定义 另 一 个 形式 语言 
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L/=S*—L, 
BLAH LCE Se. 4 —4- a CL! BAIE EL 
中 出 现 . 

容易 理解 , 知道 了 L 也 就 等 于 知道 了 Lb, 因此 工 也 是 对 工 的 
一 个 刻 划 . 但 是 一 般 来 说 , 通过 LL 来 研究 工 并 非 是 有 效 的 途径 . 
在 乔 姆 斯 基 的 层次 理论 中 ， 正 规 语言 类 22(RG) 关 于 取 补 是 封闭 
的 , 但 上 下 文 无 关 语 言 类 光 (OF) 利 递归 可 枚 举 语言 类 A (RE) I 
关于 取 补 运算 不 封闭 ， 上 下 文 有 关 语 言 类 多 (08) 关 于 取 补 运算 
封闭 是 最 近 才 得 到 证 明 的 结果 . 

现在 假定 我 们 研究 的 语言 工 总 是 具有 在 87.4 中 提出 的 两 个 
基本 性 质 ， 

性 质 工 “GE 工会 2 的 每 一 个 子 串 必 E 工 . 

性 质 23 zL- 至 少 存在 一 个 5E 8， 使 符号 串 s 也 属于 
L, 

在 $7.4 中 已 经 说 明 , 单 峰 映 射 的 形式 语言 (KS) — E FUR 
这 两 个 性 质 , 并 且 解 释 了 它们 的 动力 学 意义 。 这 两 个 性 质 在 第 8、 
9 节 的 讨论 中 起 了 极其 重要 的 作用 ， 在 下 一 章 中 ， 我 们 将 会 看 到 
在 元 胞 自动 机 研究 中 出 现 的 形式 语言 也 具有 这 两 个 性 质 ， 基 于 它 
们 的 动力 学 含义 , 我 们 给 出 

定义 ” 称 具 有 上 述 两 个 性 质 的 形式 语言 为 D 类 语言 . 《这 里 
的 字母 D 是 动力 系统 的 英文 的 第 一 个 字母 ，) 

对 于 了 类 语言 卫 , 研究 补 卫 一 信 一 工 往往 会 有 方便 之 处 ， 实 
mE, WEL, Jb e REFL, Ar, DL 为 子 串 的 任何 符号 串 也 
不 属于 L, 从 而 就 在 工 中 .这 是 反面 利用 性 质 1 的 结果 ， 

出 此 出 发 , 可 以 对 DD 类 中 的 语言 工 提 出 “禁止 字 概念， 它 是 
对 语言 的 一 种 新 的 刻 划 . 

WR EL, He 的 任何 真子 串 都 属于 工 ( 在 [58] 中 称 为 
Distinct Exeluded Block), WjfR 49-9 iB z C 5" 为 语言 EBD) 的 
REF, 
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如 在 88.1 中 指出 的 那 樟 ， 性 质 工 已 隐 含 了 空 串 sET 成 立 。 
因此 , 如 工 为 卫 类 语言 , 则 ec L', AR s AE L HORE ES. 

由 上 面 的 定义 可 见 ， 语 言 工 的 禁止 字 即 是 不 属于 工 而 长 度 达 
到 极 小 的 符号 串 ， 这 里 极 小 的 含义 是 ， 从 禁止 字 的 开始 或 结尾 去 
掉 一 个 或 多 个 符号 之 后 , 留 下 的 子 串 已 属于 工 ， 

我 们 把 禁止 字 全 体 叫 做 语言 工 的 核 , 记 为 D", 

容易 看 出 , ELL ML" 之 间 的 基本 关系 为 

L'—S*I/8*, 
L-S'—LI'—-S8*'—S*"L"S* 

L 的 一 个 基本 性 质 是 ,如果 o yc L", zy, 那么 其 中 的 任 
何 一 个 符号 串 不 能 以 另 一 个 符号 串 为 自己 的 子 串 . 

以 上 只 利用 了 DD 类 语言 所 具有 的 第 一 个 性 质 ， 从 性 质 2 可 
以 知道 ,如果 S—10, 1}, EL”, RAER IEL, 也 就 是 说 , 将 
z 的 最 后 一 个 符号 取 反 码 , 其 他 保持 不 动 , 所 得 的 符号 串 z 一 定 是 
语言 工 的 字 . | 

现在 举 几 个 简单 例子 , 其 中 均 到 5S={0, 1), 蕊 为 单 峰 映射 的 
形式 语言 . 

[ 例 1] KS-10", 

kit Les, Veeg, 

[#2] Ks=0~, 

在 $7.2 已 知名 (0”*) 一 {0"|n 宇 0}，L' 为 无 限 语言 ， 但 它 的 
核 则 极其 简单 : LU = {1}. 

[ 例 3] K8-1" 

#8728 LA") =01", 禁止 字 集 合 L7 则 仍 是 很 简单 
H.L’={10}), SRE 它 表明 在 写 符号 申 时 ， 只 要 在 符号 1 后 不 
接着 写 0, 就 得 到 工 中 的 字 . 

[54] KS-(10", 

接受 V (10) BU SB PLLA 9-2, 在 8 13.9 中 计算 了 
CH, ARZAATRTBSHEMRAR, WL’ RAL 
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是 非常 简单 的 : 
L” = (100, 1011). 

[|] 5] KS-(101)". 

这 个 例子 在 89.1 已 作 过 详细 讨论 ， 在 语言 (0017) mig 
雇 了 任意 周期 的 周期 罗 的 存在 性 , 同时 还 存在 所 谓 李 -约克 意义 上 
的 混沌 集 合 .。 实际 上 , 接受 工 的 最 小 有 限 自 动机 的 主要 部 分 与 
[18] 中 的 有 向 图 是 相同 的 .用 L” 来 刻 划 工 在 这 里 也 非常 简单 ; 

L'- (100), 

[96] KS=(100)”, 

图 9-2 PER TRB L7 (000)") 的 最 小 有 限 自 动 
机 .这 时 , 有 

I/'— (1000, 10011, 100101}, 

[NT] Kg-101" 

这 个 例子 在 89.4 和 8 14.3 中 都 作 过 讨论 。 与 以 上 例子 不 
fa), 这 时 的 禁止 字 集 合 是 无 限 集 , 但 具有 简单 的 结 攀 : 

L” = {10(11)"0},»o. 

关于 从 语言 工 = 多 (KK8) 计算 L” 的 一 般 方法 将 在 下 面 讨 论 . 
在 这 一 节 中 研究 荆 为 正规 语言 时 ，IL” 所 其 有 的 一 般 规 律 ， 下 一 
节 将 讨论 工 为 非 正 规 语言 时 的 情况 .在 这 里 , RMH, AA L” 
完全 唯一 地 确定 了 语言 工 , 而 且 其 结构 往往 比较 简单 ， 所 以 ， 有 可 
能 成 为 刻 划 工 的 一 个 很 有 希望 的 手段 . 


$15.3 有 限 补 语言 


如 果 工 为 卫 类 语言 , 同时 它 对 应 的 LU 为 有 限 语 言 , 那么 可 
以 证 明王 为 正规 语言 . 

对 于 了 "为 有 眼 语 言 前 情况， 我们 称 工 为 有 限 补 语言 (Rinite 
Complement Language). 因此 , 这 一 小 节 即 是 要 证 明 , 有 限 补 语 
言 一 定 是 正规 语言 ， 在 上 一 小 节 的 例子 中 , 除了 最 后 一 个 之 外 , 都 
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是 有 限 补 诺言 . 

采用 [53] 中 的 方法 , 我 们 指 述 上 述 合 题 的 证 明 过 程 , 并 举 一 个 
Bit. 

BLEA”, S 为 由 个 符号 组 成 的 有 限 集 ， du L=S*, 则 不 必 
Bit. HALES 为 有 限 补 语言 . 由 于 ”只 含有 限 个 符号 
ti, 可 设 其 中 最 长 的 禁止 字 的 长 度 为 6。 取 长 度 为 8 一 1 的 所 有 可 
RETE R 一 共 是 矿 -1+ 个 . 先 将 其 中 不 属于 工 的 那些 去 掉 , 其 中 包 
HALF, 以 及 含有 禁止 学 为 子 串 的 那些 符号 串 . 

将 余下 的 每 个 符号 串 作 为 结 
点 , 我 们 可 以 构造 -- 个 有 向 图 , 其 方 
ly. BRT AMM TAS E 
Herts, 考 嵌 从 这 个 结 点 出 发 
的 条 弧 , 每 一 条 弧 标 以 有 中 的 不 
VS. WARS ai aam 
EL, WHER- Gum, 4 "et 
6;85***,-18 € Li, 我 们 就 将 这 条 弧 通 向 对 应 于 dan cio RIR A 
点 ， 对 每 个 结 点 都 这 样 做 , RRR RTA. 

图 15-1J&pi L = (111) pr fasi EXE BIB. x08 5—8, k 
=2, 有 四 个 结 点 ， 根 据 上 述 方法 , 从 结 点 1 出 发 内 有 一 条 标 以 0 
的 弧 , 从 其 他 结 点 出 发 则 都 有 两 条 弧 . 

从 图 15-1 容易 看 出 , 从 任 一 结 点 出 发 ， 取 图 中 的 任何 一 条 路 
£e, 都 可 以 生成 工 中 的 一 个 字 ， 反 之 这 也 成 立 。 虽然 这 个 有 向 图 
与 $1.4 中 的 有 限 自 动机 的 状态 转移 图 似乎 并 不 完全 一 样 ， 但 再 
增加 一 些 结 点 和 弧 , 其 中 包括 一 个 初始 结 点 和 带 s 转移 的 强 , 就 可 
以 从 图 15-1 得 到 接受 工 的 一 个 有 限 自动 机 ， 从 而 也 就 证 明了 上 
为 正规 语言 . i 

HFS ELARA LU PSK EEN b dy — Rt di DC 
讨论 的 过 程 完 全 一 样 . 从 而 我 们 知道 ， 有 限 补 诗 言 必 是 正规 语 
so X—H n5 § 16.1, 
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§15.3 禁止 字 的 计算 方法 


现在 限于 讨论 =-(KS)、 RL Rte ASKS In 
ui A5 IES RH A. 
5 8 15.1 中 一 样 ,采用 记号 z 是 很 方便 的 . 
现 设 ? 是 语言 ~.2(K8) 的 一 个 禁止 字 ， 从 515.1 中 已 知 ， 
z« KS 
另 一 方面 ,2 的 每 一 个 真 后 缀 都 属于 L, 因此 可 推出 
27- KS, 
否则 ,2 的 每 一 个 后 缀 都 小 于 等 于 ES, 从 87.5 中 的 判定 法 则 可 
出 2E 工 , 引出 了 矛盾 ， 

人 台 并 以 上 两 个 不 等 式 ， 可 以 看 出 “一 定 是 揉 序列 KS 的 一 个 
HAR, 而 且 是 偶 申 . 

于 是 , 我 们 已 经 证 明 ， 语 言 工 到 (ES) 的 每 一 个 禁止 字 是 奇 
H, 而 且 在 将 它 的 最 后 一 个 符号 取 反 码 之 后 , 得 到 的 符号 申 是 揉 序 
列 的 一 个 侦 前 弘 . 

当然 , 这 只 是 一 个 符号 串 为 荆 的 禁止 字 的 必要 条 件 ， 并 不 是 
KARE. Pin, 如 

KS= (101), 
BRA 2— 101101 是 它 的 一 个 偶 前 绷 。 Xa, 2— 101100 £L, 但 不 是 
工 的 禁止 字 ， 实 际 上 ,z 的 后 级 100 是 工 的 (唯一 ) 禁 止 字 . 

应 用 在 $7.6 中 的 前 后 缀 概念 ， 容 易 证 明 ， 如 果 * 是 KS8 的 
PRR, WH: 不 存在 关于 KS 的 任何 侦 真 前 后 级 ， 则 z 是 工 
一 YLKS) 的 禁止 字 ， 实 际 虐 , 这 是 2E17 BEAD EAR. TE 
如 下 . 

设 z 为 KS BN, 则 已 上 有 ?>>K8 Re, ABEL, MR 
I 不 是 禁止 字 ， 则 由 于 z 与 * 只 在 最 后 一 个 符号 上 有 不 同 ， 而 cE 
L， 资 此 2 含 有 一 个 真 后 缀 为 禁止 字 ， 我 们 记 它 为 2。 这 时 区 是 
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KS HWS, 又 是 e 的 真 后 级 ， 因 此 已 经 找到 了 2 关于 KS 的 一 
BANKA. BDE, mE e 有 一 个 偶 真 前 后 缀 o, 那么 ?为 
TH, Aa? >KS, RRM EL 因此 以 z 为 真 后 缀 的 符号 串 
z 不 会 是 工 的 禁止 字 . 

上 述 条 件 也 等 价 于 ; “为 KS 的 俱 前 级 ， 同 时 zx 是 循环 移 位 最 
KE. 证 明 从 略 . 

利用 以 上 结果 ， 从 揉 序列 KS 出 发 很 容易 直接 确定 出 语言 
(KS) 的 全 部 禁止 字 . 


§15.4 KS 为 周期 序列 时 的 禁止 字 


按照 [58], 当 L” AARE E, 我 们 称 工 为 有 限 补 语言 ， 与 
此 相对 应 , 当 工 ”为 无 限 语言 时 , 我 们 称 为 无 限 补 语言 (Infinite 
Complement Language), iig $ 15.2 中 的 结果 , 任何 非 正规 语 
言 必 是 无 限 补 语言 ， 但 是 它 的 闭 命 题 并 不 成 立 ， 

现在 讨论 绑 (K8) 为 单 峰 映射 的 情况 . 

9.8 8 的 定理 已 知 , 这 时 只 有 两 种 可 能 ， 即 KS 为 周期 序列 或 
终极 周期 序列 . 

如 果 KS—2", 我 们 容易 证 明 , AA Lm ZZ OKS) p RB Bag 
H. 这 个 证 明 所 需要 的 准备 知识 写 在 附录 B.1 中 . 在 那里 证 明 
T: 如 eJ Bh, WE eC." (o”) 的 充分 必要 条 件 是 “ 的 每 一 个 长 度 
不 超过 |s| 的 子 串 *<z， 这 直接 推出 语言 一 .2(w”) 的 禁止 字 的 
长 度 ， 当 wm 为 侦 串 时 不 会 超过 |sij， 而 在 2 为 奇 串 时 不 会 超过 
312|. 

在 $15.1 中 的 例 2 到 例 6 即 是 上 述 结论 的 具体 例子 . 

FH, L= (2”) 的 禁止 字 只 可 能 为 有 限 多 个 . 


$15.5 KS 为 终极 周期 序列 时 的 禁止 字 


FES 15.1 中 的 例 1 为 K9=10”, 这 时 没有 任何 禁止 字 ， 而 诗 
7, B KS= 101~“， 却 告诉 我 们 存在 无 限 多 个 禁止 字 ， 这 里 的 规律 
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FEAT AWE? 

在 [3971 中 己 经 证 明 , 在 所 有 终极 周期 而 不 是 周期 的 揉 序列 中 ， 
LAO )ERAK AS. BOREL MR KS 为 终极 周期 序列 ， 但 
不 是 周期 序列 , 也 不 是 107, 那么 PKS) HEE TCR Fb 

这 里 只 介绍 从 KS-p%” 寻找 无 限 多 个 禁止 字 的 具体 方法 , 以 
BL” 的 结构 特征 , 具体 的 证 明细 节 从 略 。 

将 揉 序列 按 以 下 要 求 写 成 

KS=pi™, 
Fit Ay aR) eB CHIESE UD HS), A A= M OD). X. 
HR 6 不 以 和 为 后 缀 .由 于 K8 不 是 周期 序列 , 这 是 可 以 实现 的 . 
分 两 种 情况 讨论 . 
如 果 p 为 偶 串 , 则 当 上 足够 大 时 , 可 以 证 明 
pX CL", 
如 果 p 为 奇 串 , 先 求 出 符号 串 % 关于 KS fg a 2 OL 
$7.0), EAA, WAWER, A^ JE d B, mE k EBK 
pha! € d^: 

六 里 条 件 KS10” 起 了 作用 , 它 使 入 不 会 是 0 吊 ， 又 由 于 KS 不 
是 周期 序列 ， 因 此 和 不 会 是 KS AWA. 这 时 可 以 应 用 87.5 中 
的 结果 . 

需要 指出 , 上 述 方法 求 出 的 未 必 是 工 的 全 部 禁止 字 , 关于 LU 
的 结构 需要 另外 讨论 。 现在 举 一 些 例子 . 

[ 例 8] KS8-101(10)", 

令 p=101, 和 = 1010, 即 为 上 述 第 一 种 情况 ，、 实 际 上 ， 可 求 出 

L” = 1100) U (101(10)7*1011),,, s. 
{#9} KS8-100(011)", 
4 p—10001, 4—101, 它 也 属于 第 一 种 情况 ， 实际 上 , 这 时 的 
L” = {10001(C10T)"T003 >o。 

[5| 10] KS-100(101)7. 

这 时 p= 100 AA, T TB ANE m. Kd A—1013& T 

t40 


KS 的 最 长 前 后 HUM =l 这 对 应 于 一 族 禁止 字 
(100(101)"0],.o, 
但 实际 上 还 存在 第 二 族 禁 止 字 
{100(101)"11}, >o. 
可 以 证 崩 ， 当 -2(pX”) 航 无 限 补 语言 时 ， 禁 止 字 可 分 成 两 类 . 
第 一 类 由 有 限 族 组 成 , ETRE ROM A uan 其 中 因为 入 的 
LN E NE 第 二 类 则 由 有 限 个 散 见 的 禁止 字 组 成 . 
再 举 一 个 较 复 哥 一 些 的 例子 ， 
[f] 11] KS-—1000101(1001)*. 
利用 $ 15.8 的 计算 方法 , 容易 求 出 
L” = (10000, 100011} U11000101 01001)"0 s. 
U {1000101 (1001)"11},,.0 
U {1000101 (1001)"101},»o. 
(FAS 38.5 PHA, 我 们 也 称 以 上 工 ” 共有 半 线 性 结构 . 
这 样 , 我 们 已 经 证 明 ,8 15.2 中 论断 的 逆 命题 不 成 立 .也 就 是 
说 ， 虽 然 有 限 补 语言 必 为 正规 语言 ， 但 正规 语言 可 以 是 无 限 补 语 
言 ， 对 于 多 (KKS) 为 正规 语言 的 两 种 情况 , BLU RAMEN 
法 揭示 了 它们 之 间 的 不 同 点 ， 世 就 是 说 ， 在 东 意 图 9-6 中 的 两 端 
昌都 属于 复杂 性 层次 中 RES 但 实际 上 仍 存 在 本 质 差 异 ， 


$ 16 RET SERES a 


本 节 首 先 讨论 工 和 也" 在 乔 姆 斯 基层 次 体系 中 所 处 层次 之 间 
的 关系 ， 然 后 , 对 于 在 单 蜂 了 映射 的 几 个 已 知 的 非 正 规 语言 , 分 别 计 
算 了 它们 的 禁止 字 结 构 ， 材 料 主要 来 自作 者 正在 进行 的 工作 . 
§ 16.1 L fo Li 的 草 姆 斯 基层 次 
kL DRA, 7 为 工 的 禁止 字 集 台 、 如 过 去 一 样 ， 记 
ERAS 正规 语言 类 ， 那 么 , 容易 证 明 ， 
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LE ZRG) e L'€ Z(RQ), 
实际 上 , 从 关系 式 L8 -CLS 出发， 利用 语言 类 TORO) 
于 到 补 运算 和 连接 运算 封闭 (参见 $1.9)，, 就 可 以 从 LE Z CRG) 
iti Lc.Z(RG). 

另 一 方面 ， 再 利用 8$1.9 中 语言 类 Z(RG)X Tb SUE E31 
MIN 运算 封闭 , 就 可 以 推出 另 一 半 结 论 ， 说 得 详细 一 点 ， 从 LE 
(RG), 35 L/ - 8" —L€ Z(RG), bius, 定义 

L,-MIN(I/)€.£(RG), 
RAAB L'Oli 然后 , 又 有 
L-LfC.Z(RG), 
这 里 db La 的 镜 象 ， 可 以 证 明 , 有 
L” = (MIN(12))*, 
因此 就 推出 LE V (RG), 

这 同时 也 证 明了 , 工 为 非 正 规 语言 的 充分 必要 条 件 是 ”为 非 
EREA. | 

可 以 设想 ， 上 述 关 于 工 和 IL” 同属 乡 (RG) 的 结论 也 许可 以 
推广 到 乔 姆 斯 基层 次 体系 中 的 其 他 每 一 个 层次 由 于 .ZCOF) 关 
于 补 运算 与 MIN 运算 不 具有 多 (BRGI) 的 性 质 , 不 是 不 封闭 就 是 还 
不 知道 是 否 封闭 , 因此 上 述 证 明 方法 失效 ， 已 经 证 明 , LAL H 
i (08) 和 递归 函数 类 的 结论 成 立 ， 但 对 于 Z(E), dL 
L' 都 不 是 递归 语言 , 则 结论 一 定 不 成 立 , 

但 是 对 于 单 妖 喘 射 生成 的 语言 Lu (KS), HRS WERE 得 
多 . | 
我 们 先 证 明 , 如 果 这 时 的 L7 为 上 下 文 无 关 语 言 ,那么 它 一 定 
也 是 正规 语言 , 

这 里 的 主要 工具 是 在 $8.5 中 介绍 的 第 一 个 定理 ， 如 果 工 是 
一 个 上 下 文 无 关 语 言 ， 即 存在 一 个 上 下 文 无 关 语法 G， 使 工 
~L(G)， 如 果 REFR REE N 工 为 正规 语言 . 

这 里 的 非 自 向 讲 性 质 是 在 派生 过 程 中 不 出 现 4 29 aA, 其 


142 


中 4 为 变量 , w 和 有 是 由 变量 和 终结 符 组 成 的 非 空 圳 . 

mi L= ZKS), LY 为 上 下 文 无 关 语言 ， 这 时 存在 一 个 上 
下 文 无 关 语法 G, 使 

G=(V, 8, P, s), L’=L(@), 
HER UL), 可 以 假设 G 的 每 一 个 变量 4 都 是 所 谓 有 用 变量 , 即 存在 
派生 
So Eis wm E P 

Us wc US, ves, 又 不 妨 假 设 w 和 w 中 已 不 含 变 量 . 

如 果 上 述 怠 已 具有 非 自 赃 套 性 质 , 则 不 必 再 讨论 。 否则 ， 设 
存在 一 个 AET, tt 


A = «AB, 
HEFER a 和 有 中 也 已 不 含 变量 ， 由 于 4 为 有 用 变量 ， 存 在 派生 


So oe wAg S aibe 
TERA T two" AB's 对 一 切 n=O Br. 


设 4 一 > 8, DES, WARMA HA AL HHF 
(wa" BÉ") aso, 

由 于 在 $15.3 中 的 讨论 ， 我 们 知道 每 个 禁止 字 的 每 个 真 前 缀 
都 是 揉 序列 KS WAT. 由 以 上 讨论 ， 可 见 揉 序列 KS 一 定 以 
{wa duro 中 任何 一 个 符号 囊 为 前 级 ， 从 而 只 能 是 

KS-wa^, 
即 终极 周 斯 序列 或 周期 序列 .应 用 8 8 RR, Lo (KS) Hie 
规 语言 ， 然后， 再 应 用 这 一 小 节 一 开始 的 结果 ,就 证 明 LU ti 
MBA. 

回顾 $12.4， 我 们 看 到 ， 虽 然 对 于 单 蜂 映射 中 的 形式 语言 L 
«2 (KS), 猜测 

LE Y(OF) = LEZ (RG) 
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尚未 证 明 , 但 对 于 T 而 言 , 则 已 建立 了 这 样 的 事实 ， 

由 浴 上 讨论 可 知 , 对 于 非 正规 诸 言 工 = .2(KS)， 它 的 禁止 字 
KA L CFE URE BR LEXAR, 

Al SE M E SRS MR (0,8 10.3), RRS 
上 下 文 有 关 语 言 的 线性 有 界 自动 机 ( 见 $ 2.6), 不 难 证 明 

LEFY(CS) e Le 208), 
这 里 (O09) 是 上 下 文 有 关 语 言 类 . 

对 于 更 高 层次 的 语言 类 , 容易 建立 以 下 事实 ， 对 一 般 的 D 类 
语言 L， 工 为 递归 语言 和 LL" 为 递归 语言 是 等 价 的 ， 对 于 工 
- (K8), L' 为 递归 可 枚 举 语言 时 , 工 也 -一定 是 递归 语言 ， 这 里 
的 递归 语言 类 是 在 8 2.5 中 介绍 过 的 ， 介 于 递归 可 枚 举 语言 类 
.ZLRB) 和 上 下 文 有 关 语 言 类 -2(O8) 之 间 的 一 个 语言 类 

这 里 不 清楚 的 是 , XP L- V (KS) eB, 是 否 成 立 

LE€.Z(RE) > L 为 递归 语言 ? 

对 于 工 各 1 中 有 一 个 属于 . 终 (RE)， 但 不 是 递归 语言 的 情 
m 容易 知道 ， 另 一 个 必 是 非 递 归 可 校 举 语言 .实际 上 ， 和 否则 将 导 
a LAL 同属 于 LORE), 从 而 它们 都 是 递归 语言 (这 里 所 用 到 
的 事实 可 参看 [1 一 [6])， 这 然 ， 站 和 了" 都 不 属于 FRE) thi 
可 能 的 . 

由 以 上 分 析 可 见 , 如 L-Z (KS) hae ERE N, 则 对 于 具体 的 
例子 来 说 , 禁止 字 和 集合 1” 均 属于 上 下 文 有 关 语 言 ， 由 于 目前 还 块 
乏 系统 的 理论 ; 以 下 几 闻 分 别 研究 几 个 在 第 4 章 已 出 现 过 的 例子 ， 


§16.2 RIRA] FH LS 
5j § 10 一 样 , 用 记号 如 表示 费 根 鲍 姆 吸引 子 的 揉 序 列 : 
&.—1011 1010 1011 1011 + : 


利用 8 15.3 的 计算 方法 ， 容 易 看 出 按 长 度 排列 的 前 几 个 禁止 字 是 
100, 10110, 101111, 


采用 810 的 记号 , dd 
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h={0->11, 1-0 
为 信 周 期 分 盆 引 出 的 同 态 ， 我 们 知道 , 有 
t=" (Í), A.) —1., 
现在 来 证 明 语 言 工 = 乡 ( 久 ) 的 禁止 字 集 台 为 
L’ = {h"(100) >o U (&" (10110), o, 
这 里 的 关键 在 于 证 明 , 除了 100 和 10110 之 外 , 8 —^A- 3k ES HE 
度 都 是 偶数 . 

现在 我 们 假设 > 是 一 个 奇数 位 长 度 的 禁止 字 . A S 15.9 可 
AL £d to 的 偶 前 级 , KEBES. HT to 的 奇数 位 符号 都 是 
1(5L§ 10.25, 因此 ,2 的 最 后 一 个 符号 一 定 是 0， 这 样 ， 就 可 以 记 
禁止 字 为 

a= ta, 
3Cr | aO|<[t,[=2", tho: 是 to B AAR. 

inu ake, WEE $20, S o — fa^, 其 中 lo c 165] 一 2 
因为 禁止 字 c WAH, 如 也 是 奇 串 , 因此 o RETR. XIA 

0/0 7-a'1, 
由 于 o 的 长 度 为 偶数 , al 是 如 的 前 绷 ， 从 而 导致 OL, KH 
e 为 禁止 字 相 矛盾 

Alas 则 wz 一刀 9， 如 %% 为 奇数 ， 则 容易 归纳 证 明 出 每 个 
tp 以 0 结尾 , 从 而 @ DL 100 为 后 级 ， 由 于 为 禁止 字 , 所 以 只 能 是 
c=100, Wn WRK, 那么 同样 可 证 明 每 个 (nz>2) 以 1011 为 后 
m. hF ss 以 禁止 字 10110 39 fa 88, 所 以 c — 10110. 

于 是 , 如 果 sc LU, (84.58 100 zy, 10110, WAles] ABRA. 
HFP ot. HR, 奇数 位 均 为 符号 卫 因此 AT (ey RE XS 利 
H h GRAY, 以 及 $ 15.,3 中 关于 禁止 字 的 充分 必要 条 件 , T LA) 
也 是 语言 工 =-Y (te) RIES, MRA oO) AK, Alay 
以 证 明 h-?(z) 也 是 禁止 字 ， 依 次 类 推 , 最 后 得 到 7 (n) AE 100, 
就 是 30J19, 从 而 g A^ (100) n, À"(10110), WE, 

Hp LY 中 字 长 的 规律 很 简单 , BI 3-27 30 5-27, 2-0, 
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在 上 一 小 节 中 已 经 证 明 、 对 于 单 峰 映射 的 非 正规 语言 了 (= 
FIKS) 禁止 字 和 集合 1." 不 会 是 上 下 文 元 关 语 言 . 

HF LSZ Ge) AL 中 字 长 的 上 述 结 构 , 容易 直接 看 出 LU 
不 是 上 下 文 无 关 语 言 . 实际 上 , 如 果 I 为 上 下 文 无 关 语言 , 则 可 
以 用 同 态 

g={0— 0, 10]. 

这 时 由 语言 类 SOMKTA SHA, A (LU) 也 是 上 下 文 无 
关 语言 ， 但 9(LT' 门 是 由 一 个 符号 生成 的 形式 语言 ， 应 用 8 3.5 中 
的 定理 2, 9g(L") 也 是 正规 语言 , 同时 其 中 的 字 长 所 成 的 整数 集 为 
PREE HFL 目前 的 字 长 集合 明显 不 是 半 线 性 集 ， 因此 就 
推出 LY 不 是 上 下 文 无 关 语 言 . 

容易 直接 证 明 L 为 上 下 文 有 关 语 言 ， 除了 直接 从 岂 态 疡 和 
线性 有 界 自动 机 前 定义 来 作出 证 明之 外 , 也 可 以 从 $4.1 出 发 , 用 
DOL 系统 生成 (5 (100) Jot {A" (10110) Jazo. H DOL 语言 看 
成 ETOL 语言 的 特例 , 即 可 推出 LY 为 BTOL 语言 ， 从 而 也 是 上 
下 文 有 关 语 言 . 

可 以 将 以 上 讨论 届 第 4 章 中 前 两 节 对 比 ， 讨 论 L” 比 讨论 工 
BRA HAZ. 

KF L” 引进 一 个 指标 we 有 时 是 很 有 用 的 ， Mu i LS 
长 度 不 超过 天 的 禁止 字 个 数 , 然后 计算 


"E 
a= lim —, 
k-roo k 


称 w 为 7 的 指标 ”如 果 极 限 不 存在 则 可 以 取 上 极限 ， 我 们 可 以 
说 & 是 对 "的 一 个 刻 划 , 当然 也 是 对 工 的 一 个 刻 划 . 

应 用 $ 3.5 的 定理 2, 如果 1 是 上 下 文 元 关 语 言 或 正规 庄 言 ， 
旦 为 无 限 语言 , 那么 由 于 LU 的 字 长 所 成 集合 为 半 线 性 集 , TE a 
HERR. RVR, mF 工 为 无 限 补 语言 , 指标 a 一 0, BE LU — 
定 不 是 上 下 文 无 关 语 言 ， 当 然 , 这 只 是 一 个 充分 条 件 . 

对 于 工 =.2(fo)), 在 b=65.2"* 时 ,nz 二 2(n 十 1)， 由 此 容易 证 明 
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指标 a=0, 
BIEEEC EZ EAST IER 


现在 研究 在 § 12.2: p fp ZR By PR E RAR RE REY AR IE 为 
简单 起 见 , 只 讨论 在 8 12.9 中 的 第 一 个 例子 ido 101, 8— 11, 
引入 同 态 


h-ía-—axB, B-»a«B), 
3t Hid 


en ^ (a), 
就 可 以 得 到 揉 序列 


Ceo = lim e,, 
poo 


RIA Aa). ER 12.8 的 第 一 行列 出 了 e 的 前 82 fr, 
BA L-Le..) Bene. 所 确定 ， 但 直接 从 e 出 发 分 析 工 
的 结构 是 件 不 太 容易 的 工作 ， 我 们 可 以 看 到 ， 工 的 禁 小 字 集 合 很 
简单 ， 从 6 一 1011011110… 已 可 求 出 最 短 的 两 个 禁止 字 是 
100 和 10110110, 
可 以 将 它们 记 为 (= 他 和 (= aa), 
我 们 将 要 证 明 L= .2(ew) 的 禁止 字 集 合 为 
Li = (6,) so. 
应 用 数学 妇 纳 法 ， 设 .所 …'.6, 已 是 工 的 禁止 字 ,而 且 工 没有 比 
它们 中 任何 一 个 更 短 的 禁止 字 ， AEB. 的 前 级 on MEH 
§ 15.8 的 充分 必要 条 件 在 其 中 能 生成 几 个 新 的 禁止 字 . 
S Gnas t1(a) =k ahak (B) ee CB), 
观察 它 的 长 度 超过 |s,| 的 偶 前 级 ， 因 为 6 ASEH ADB, 
从 eue, 的 偶 前 级 不 会 生成 禁止 字 ， 现 在 将 第 三 个 因子 写 为 
h^ (B) - h"7* (ah ( B) =6,.16,-2°""61608, 
出 于 每 个 &( 其 中 ==0, 1, n 1) I ER; T] B — 11, PERI esas 
中 只 有 各 上 a 才 可 能 是 新 的 禁止 字 . 
这 里 义工 是 明显 的 .为 了 证 明 Cu 确实 是 禁止 字 ， 只 要 
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ik B] 6,4: 不 以 so.et Les PRSE REI Tr 2m JR. Tui 
6.257 66h" (B), | 
6, = 6, 16,15" (8) e e," CB), 
利用 数学 归纳 法 , 即 可 完成 这 个 证 明 . 
现在 来 计算 在 8 16.3 中 提出 的 指标 æ, 
PRSE hl AORERE N mm Alb, ME DENTE 
关系 


G,41— 2an t 5,, bata = Ant by, 
求 出 系数 阵 的 特征 值 , 即 可 得 到 
lim Gua | 9D z;2.296--., 
fie Cba A 


由 于 长 度 不 超过 a. RIES TRA nd, 可 以 看 出 指标 ww 一 0. 
由 $ 把.2 的 讨论 知道 ,了 BAER KEP AL PARI. 
利用 了 系统 可 以 证 明 工 "是 ETOL 语言 ， 从 而 确 是 上 下 文 有 关 语 


pall 


816.4 sp Xm AA a MR 
只 讨论 在 $12.3 中 的 第 二 个 例子 ， 
AE S. rd as 
h-—10-»110, 1->10110}, 
X4 mo-i,mi-10. ma—101, 然后 定义 fm,}wwo 为 按照 
bh (mas) — mas 
生成 的 符号 串 序列 这样 可 以 得 到 揉 序列 


Meo = lim Mn, 


moo 


在 这 个 例子 中 工 = 儿 (ms) 的 禁止 字 集 合 L” 的 计算 要 比 前 两 
小 节 的 情况 复 米 .， 下 面 只 证 明 它 的 指标 w 浆 0， 然 后 结合 共 他 讨 
论 可 推出 工 为 上 下 文 有 关 语 言 . 
从 [oo 的 定义 可 以 建立 两 个 基本 公式 ， 
703144 — Tham; -a731-2, 
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Tha, 75 31 27031 31081 25 
121, 同时 ， 每 个 mat 和 Mara 是 奇 "m. 

Jum oy LIE, EIEI] maul WA 121 
|ms|， 这 意味 着 ， 从 man 中 能 生成 禁止 字 的 前 级 必 在 上 述 第 一 
个 公式 右 方 的 第 一 个 因子 肉 ， 用 反 证 法 ， 如 果 却 = max, |ul< 
maia |» 那么 可 写 出 

fb — Ma- Ma- Mg, 
这 时 manou 是 s ATR, 从 而 也 是 揉 序列 Mo WR. Ho 
RR ey Oh A, 可 推出 mu 是 mm。 PET. 应 用 $15.8 的 条 
件 , 5j oy RIE IR, WE 2 = msma, [u| < [mual 38 
4 u tide ma WAME, 又 与 2 为 禁止 字 相 矛盾 ， 

同样 可 以 证 明 ， 如 4 为 禁止 字 ， 且 |21<|ma|， 那 么 1 和 4 
| 031-2231 8] è 

MER n 是 语言 = 20m.) 的 长 度 不 超过 meas 的 禁止 字 
的 个 数 , 那么 只 要 证 明 

Tii 
i 


c ceu: 
Pec | 772-3743 | 


就 可 以 证 明 指标 =, 
直面 分 别 计算 数列 {mj} 与 {|mairst1 的 增长 数 ， 
分 母 的 增长 数 计算 是 容易 的 。 Mima lho 即 为 斐 波 那 契 数 
列 1、2、3、5、8、…， 可 见 它 的 增长 数 为 (1+\/ 5 2/2, 于 是 ， 
Umoussl)iso 的 增 长 数 是 
lim Vimal GAY EY a 286, 


Bp DAVE BA Gn E388 EAA 
lim Vn 一 1 VF 2. AAD», 
MATHER np EA VE BH Br 09 98 SR. 
为 简单 起 见 , 估计 出 极限 
lim Vn «3 
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也 已 经 够 了 ， 下 而 我 人 写 出 估计 的 方法 . 
AATEC, KERR mae 的 禁止 字 有 两 类 .， 第 
一 类 长 度 不 超过 mas 共有 mi-1 个 ， 第 二 类 禁止 字 的 形式 为 mut, 
其 中 &% 是 ms, 3 8r. 
(0 Am = maicsms;-smei-s WUA R, EX u REE ma-e Ay 
或 者 超过 ma-ma- All mai 不 会 是 禁止 字 . 
从 misi- 2 = 031-1 evai-s WOAH, 也 有 同样 的 情况 ，. 
用 归纳 法 可 以 将 这 个 分 析 继 续 下 去 直到 wa 和 mo 为 止 . 
MER p EE mov 中 合乎 上 述 要 求 的 奇 前 织 的 个 数 ，g1-1 是 
ma- 中 合乎 上 述 要 求 的 奇 前 级 ， 那 么 从 上 述 讨论 得 到 
9 — ui pr, 
p= 2g, 
Qqi-i—i-id Gi-s 
从 后 两 个 等 式 得 到 gi 一 39,;-2， 利 用 mo —10, 可 以 确定 go 2, 从 
而 得 到 
q; 72-871, pia 4-873, 
MEM e — niis p, 出 发 ， 又 从 ms — 10110 可 见 只 有 一 个 偶 
前 部 101, 因此 ”= 工 这样 就 可 估计 出 
Tw nd pad pin 2-8 —1, 


因此 得 到 
limma <8, 
这 样 就 完成 了 指标 的 计算 . 
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第 6 章 


元 胞 自动 机 


本 章 将 前 几 童 中 发 展 起 来 的 方法 用 于 与 区 间 映 射 完全 不 同 的 
另 一 类 动力 系统 的 研究 . 

元 胞 外 动机 机 以 看 成 为 无 穷 维 动力 系统 中 的 一 类 ， 其 特点 古 
空间 .时 间 和 状态 都 离散 , 同时 每 一 个 变量 只 取 有 限 多 个 状态 . 

本 章 共 有 五 节 , BPA S 17 到 $ 21, 1€ 8 17 中 介绍 了 基本 概念 
和 动力 学 行为 的 四 类 现象 . 8 18 介绍 了 数学 记号 与 凡 个 基本 事 
实 ， 它 们 对 于 元 胞 自动 机 的 研究 均 是 必要 的 知识 .8 19, 8 2320 分 


”日 分 析 了 语言 的 复杂 性 ， 其 中 利用 了 最 小 自动 机 、 禁 正字 以 及 在 


8 L'BÁPIRIULSA SRS. ERR ARAMA. 
本 章 完全 是 引 论 性 质 的 介绍 . 大 量 的 未 解决 问题 为 这 个 困难 
而 有 趣 的 领域 展现 了 广 妆 的 前 景 . 


$i 元 胞 自动 机 的 基本 概念 


本 节 是 关于 元 胞 自动 机 的 一 般 性 介绍 . 材料 主要 取 自 [92]、 
[93]. 


$17.1 一 维 元 胞 自动 机 


设 在 一 条 直线 上 按 等 间隔 方式 分 布 着 完全 相同 的 一 系列 元 胞 
(Cell), 抽象 地 可 以 认为 这 里 的 每 个 元 胞 是 具有 一 定 功 能 的 信息 
处 理 机 或 自动 机 ， 它 们 的 功能 将 在 下 面 介绍 ， 

每 一 个 元 胞 的 状态 只 有 有 限 多 个 .对 于 只 有 两 个 状态 的 情况 ， 
我 们 与 本 书 其 条 部 分 一 样 , 用 符号 0 和 1 来 表示 它们 . 
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假设 上 述 吉 线 在 两 个 方向 上 都 没有 限制 ， 因 此 就 有 无 限 多 个 
元 跑 ， 所 有 元 胞 的 状态 全 体 可 以 用 双 侧 无 限 的 符号 序列 表示 出 
来 ， 我 们 称 每 一 个 这 样 的 序 还 为 元 胞 目 动 机 的 一 个 构 形 《Config- 
uration), 为 了 确定 起 见 ， 可 以 将 分 布 在 直线 上 的 元 胞 位 置 与 整 
数 全 体 对 应 起 来 ， 特 别 是 将 与 整数 0 对 应 的 位 置 称 为 基点 . 胡 记 
AE a, 则 可 以 表示 成 

a= ("g_at"), 
其 中 ao 是 在 基点 上 的 元 胞 状态 , 其 余 依 次 类 推 . 

每 个 元 跑 的 状态 看 成 是 一 个 变量 , 它 只 能 取 有 限 个 值 , MAR 
个 状态 ， 于 是 上 述 元 胞 自动 机 即 是 有 无 限 多 个 变量 的 系统 . 

假设 时 间 也 是 离散 化 的 、 用 i 表示 时 间 ， 它 取 整 数值 ， 称 # 
< 一 0 为 初始 时 刻 ， 它 的 下 一 时 刻 为 =l, 

所 有 元 胞 的 状态 是 同时 发 生变 化 的 , 记 在 时 刻 tT a, 
那么 在 时 刻 t+ 1 的 构 形 et 完全 由 a! 决定， 同时， 在 时 刻 t 寺 1 
的 第 5 个 元 胞 的 状态 是 由 时 刻 t 的 第 6 个 元 胞 以 及 相 邻 的 距离 不 
超过 了 的 27 个 元 胞 的 状态 所 决定 的 ， 用 公式 写 出 来 即 是 

aj = f (aii c, Bet, Gis 0i 41 ;:75 Ger » 
其 中 的 映射 了 与 和 和 上 都 无 关 ， 我 们 称 了 为 邻 焉 半径 ， 称 了 为 元 
胞 自动 机 的 局 部 映射 或 局 部 规则 . 

id S AARRAR 由 以. 和 了 完全 确定 了 -个 元 胞 自动 
机 . f EA SU RAS BEES. 

K—- PS ERM ah, asa, WALL BH S) a 
a”, …。 因 此 可 以 将 元 胞 自动 机 作为 动力 系统 来 研究 . 

以 下 介绍 最 简单 的 初等 元 胞 自动 机 . 

设 S={0, 1}, r=1, 这 时 局 部 映射 为 

ay*) = fais , a, tha), 
BASRA SRAS HHH 自 变 量具 有 八 种 可 能 组 合 ，、 只 要 绽 
定 了 在 这 八 个 自 变 量 组 合 上 的 值 , 了 就 完全 确定 了 ， PRIT-IQ)NI 
是 一 个 例子 , 在 第 一 行列 出 了 从 111 到 000 的 八 种 组 合 ， 
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a) 111 3110 101 100 011 010 001 000 


ut) 010111110101011100010 
1010001010101010001 
图 17-1 

在 每 种 组 合 的 下 方 标 出 了 的 值 . 在 (ii) 中 的 第 一 行 代 表 某 个 构 形 
申 的 一 段 , 第 二 行 则 是 按照 了 从 第 一 行 得 到 的 符号 串 , 它 在 两 端 各 
少 一 个 符号 , 因为 那 要 取决 于 第 一 行 两 端 尚未 写 出 的 符号 . 

出 此 可 见 , S= (0, Lp Al v--1 mj ag f Ho 2*(—256) 种 可 能 
性 ， 它 们 对 应 于 256 种 不 同 的 元 胞 自动 机 ， 通 常 称 为 初等 元 胞 自 
动机 . 

HES 中 具体 采用 什么 符号 并 不 重要 ， 这 里 重要 的 是 S 所 
含 符号 的 个 数 因此 , 上述 初等 元 胞 自动 机 雇 称 为 上 =2 和 7 一 工 
的 元 胞 自动 机 . 

现在 介绍 初等 元 胞 自动 机 的 编号 方法 。 以 图 二 ~1(i) 为 例 , 将 
了 的 八 个 值 按 从 左 到 右 的 顺序 看 成 为 一 个 八 位 的 二 进 制 Be 01001 
100, 然后 计算 它 的 十 进 制 值 , 得 到 

1x644+1x8+1x4=7%6, 

这 就 是 这 个 元 胞 自动 机 的 编号 ， 今 后 称 它 为 26 号 初等 元 胞 自动 
机 ， 反 之 , 对 于 从 0 到 255 中 的 任何 一 个 十 进 制 数 , 容易 将 它 改写 
成 八 位 的 二 进 制 数 oraa…oaxo， 然 后 按照 l-a, 110->a5, …， 
000-~>oo 定义 局 部 映射 了 这样 就 完全 确定 了 一 个 初等 元 胞 自动 
dL. 


§17.2 及 种 推广 


可 以 研究 分 布 在 半 无 限 直线 上 的 元 胞 自动 机 ， 这 时 将 它 的 一 
个 端点 记 为 5 二 0, 而 用 所 有 非 负 紧 数 表示 元 胞 位 置 。 在 局 部 映射 
fit, ABRAM a tiat, Guar 我 们 称 这 样 的 元 胞 自动 机 
为 单 向 (One-Way) 元 胞 自动 机 . 

如 果 局 部 映射 的 形式 为 
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aj! = flaj_, tattare ), 
即 在 邻 域 中 每 个 元 胞 的 状态 都 起 同样 作用 ， 则 称 为 完全 (Tota]f- 
stic) 元 胞 自动 机 . 

可 以 证 明 ， 一 般 揭 元 胞 自动 机 的 动力 学 行为 一 定 可 以 用 某 个 
适当 的 单 向 元 胞 自动 机 或 完全 元 胞 自动 机 来 模拟 ( 见 [93] 、[93]) 

在 用 元 胞 自动 机 模拟 某 些 物理 现象 时 ， 往 往 会 对 局 部 瞻 射 提 
HESS i ME SUIT 

1° 如 将 符号 0 看 成 为 静止 状态 , 则 要 求 

F(O, 0, +++, 0) =9, 

2° 除了 了 与 了 无 关 这 个 反映 空间 齐 性 的 条 件 之 外 , LEER f 

是 对 称 的 , 即 
F (Gary n, y tm un) m Foe n a; rs Ge), 
它 是 空间 各 向 同性 的 反映 . 

称 满 足 这 两 个 条 件 的 元 胞 自动 机 为 合法 (LegaJ) 元 胞 自动 机 ， 
E k=2 和 7 一 1 的 256 种 初等 元 胞 自动 机 中 ， 有 93 种 是 合法 的 ， 
其 中 包括 图 17-10) T 号 在 内 . 

以 上 介绍 的 都 是 一 维 元 胞 自动 机 .当然 可 以 研究 高 于 一 维 的 
元 胞 和 白 动 机 .其 中 最 著名 的 一 种 是 在 七 十 年 代 册 康 威 (J. H. 
Qonway) 提 出 的 “生命 游戏 "(Game of life), 下 面 作 些 简单 介绍 . 

生命 游戏 是 一 个 二 维 元 了 胞 自动 机 ， 设 想 将 平面 划分 成 方 格 棋 
fi, 每 一 个 方 糙 代表 一 个 元 胞 自动 机 ， 它 有 两 个 状态 ， 用 符号 0 表 
示 死亡 , 用 符号 1 表示 活着 .每 个 元 胞 在 下 一 时 刻 的 状态 ( 死 或 活 》 
是 由 当前 时 刻 的 这 个 元 胞 和 与 它 邻 接 的 八 个 元 胞 的 状态 所 决定 
的 . 

上 基体 规则 如 下 ， 如 果 一 个 元 跑 处 于 活着 的 状态 ， 则 在 八 个 相 
邻 元 胞 中 有 两 个 或 三 个 活着 时 ， 在 下 一 时 刻 继 续 活 着 ， 否 则 就 死 
亡 ， 这 个 规则 模拟 生命 在 过 分 拥挤 或 孤单 时 不 能 生存 下 去 ， 另 一 
方面 , 如 一 个 元 胞 处 于 死亡 状态 , 但 在 邻 域 中 有 三 个 元 胞 处 于 活着 
的 状态 , 则 下 一 时 刻 这 个 元 胞 的 状态 变 成 活着 , 否则 仍 保 持 死亡 状 
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态 ， 可 以 用 计算 机 来 模拟 这 些 规 则 ， 也 容易 利用 电子 技术 做 成 游 

ROL, 有 趣 的 是 ， 用 这 些 简 单 规则 定义 的 这 个 元 胞 自动 机 能 够 模 

拟 生命 活动 中 的 生存 灭绝、 竞争 等 等 复杂 现象 .康成 还 证 明 ， 这 

个 元 胞 自动 机 具有 通用 图 灵机 的 计算 能 力 (参见 $2.4 和 [1])， 
关于 这 里 介绍 的 生命 游戏 , 可 参看 [151、[94]. 


$17.89. 元 胞 自动 机 的 一 般 特征 


这 里 列举 以 下 特征 . 

空间 离散 、 齐 性 ”这 反映 在 每 个 元 胞 的 变化 都 服从 相同 的 规 
律 ， 元 胞 的 分 布 方 式 相 同 . 

时 间 离 教 ” 这 与 前 几 章 一 样 . 

RARR AMR ”这 与 前 面 的 迭代 映射 不 同 ， 在 那里 的 状态 
是 连续 的 ,只 有 经 过 粗 粒 化 处 理 后 才能 转化 成 符号 序列 ， 对 于 元 
胞 自动 机 不 存在 需要 粗 粒 化 处 理 的 问题 . 

同步 计算 可 以 将 元 胞 自动 宙 的 构 形变 化 看 万 为 是 对 数据 或 
信息 的 计算 (或 处 理 )， 这 时 的 重要 特征 是 计算 的 并 行 性 ， 这 与 图 
灵机 很 不 一 样 . 在 第 工 章 中 介绍 的 各 种 自动 机 , 包括 图 灵机 在 内 ， 
都 有 专门 的 读 入 头 或 读 写 头 , 每 一 个 时 刻 完 成 一 步 动作 , 即 完全 按 
串 行 方式 工作 ， 元 胞 自动 机 的 工作 方式 与 $4 中 的 并 行 重 写 系统 
有 相同 之 处 . 

局 部 性 “每 一 个 元 胞 的 当前 状态 ， 只 对 于 半径 ”的 邻 域 中 的 
元 胞 在 下 一 时 刻 的 状态 可 能 发 生 影响 ， 从 信息 传输 的 角度 来 看 ， 
在 元 胞 自动 机 中 的 信息 传输 速度 是 有 限 的 . 

维 教 高 ”在 动力 系统 中 一 般 将 变量 的 个 数 称 为 维 数 , 例如 , 将 
区 间 有 映射 生 成 的 动力 系统 称 为 一 维 动 力 系 统 ， 将 平面 映射 生成 的 
动力 系统 称 为 二 维 动力 系统 ， 对 于 由 偏 微 分 方程 描述 的 动力 系统 
则 称 为 无 穷 维 动力 系统 。 从 这 个 角度 来 看 , 元 胞 自动 机 是 一 类 无 
穷 维 动力 系统 ， 在 具体 应 用 中 或 在 计算 机 模拟 时 当然 不 可 能 真 的 
处 理 无 限 劣 个 变量 ， 但 一 般 也 总 是 处 理 数量 很 大 的 元 胞 组 成 的 系 
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因此 可 以 说 维 数 高 是 元 胞 自动 机 研究 中 的 一 个 特点 ，. 
$17.4 动力 学 行为 的 分 类 


如 前 面 法 指出 , 可 以 将 元 胞 自动 机 看 成 为 动力 系统 , 从 而 可 以 
将 初始 点 轨道、 不 动 点 、 周 期 软 和 终极 周期 轨 等 一 系列 概念 用 到 
元 胞 自动 机 的 研究 中 来 ， 但 日 前 的 “点 ” 肪 是 一 个 构 形 ， 即 一 个 双 
WE JEU TEE HF I, 它 本 身 可 以 有 结构 .在 区 间 映 射 中 的 区 间 对 应 
于 这 里 由 所 有 构 形 组 成 的 集合 , 今后 常 称 之 为 ( 构 形 ) 空 间 . 

KK RBM (S. Wolfram) 在 大 量 的 计算 机 实验 的 基础 上 , 提 
出 可 以 将 所 有 元 胞 自动 机 的 动力 学 行为 归纳 为 四 类 : 

i1， 趋 于 一 个 空间 平稳 的 构 形 ， 这 里 空间 平稳 即 指 每 一 个 元 
胞 处 于 相同 状态 . | 

2. 趋 于 一 .系列 简单 的 稳定 结构 或 周期 结构 . 

8. 表现 出 混沌 的 非 周 期 行为 . 

4. 出 现 复 杂 的 局 部 结构 , 或 者 说 是 局 部 性 的 混沌 ， 其 中 有 些 
会 不 规则 地 传播 . 

这 种 分 类 不 是 严格 的 数学 定义 (参见 [93] PARA). AB 
来 说 , 前 三 类 行为 相当 于 低 维 动 力 系 统 中 常见 的 不 动 点 .周期 轨 与 
混沌 ， 而 第 四 类 行为 则 可 以 与 生命 系统 等 复杂 系统 中 的 自 组 织 现 
Suid. 

在 图 1I-2 中 给 出 了 六 个 元 胞 自动 机 的 计算 机 实验 结果 , 其 中 
包含 了 上 述 四 类 行为 . 每 一 个 图 的 第 一 行 表 示 初 始 时 刻 i 一 0 的 构 
形 中 的 有 限 部 分 ， 它 是 随机 选取 的 . 其余 各 行 均 是 从 上 一 行 按照 
所 标 出 的 局 部 规则 计算 所 得 的 结果 , 在 图 形 中 用 白 格 代表 符号 0， 
用 黑 烙 代表 符号 1, 在 计算 机 上 运行 时 对 两 端 采用 周期 边界 条 件 ， 
这 相当 于 将 有 限 多 个 元 胞 布置 在 一 个 圆周 上 来 应 用 局 部 规则 . 

在 六 个 图 中 有 五 个 是 初等 元 胞 自动 机 ， 在 每 个 图 的 下 边 写 出 
了 它们 的 规则 编号 以 及 相应 的 八 位 二 进 制 数 ， 由 于 已 知 在 初等 元 
胞 自动 机 中 不 出 现 上 述 第 四 类 行为 , 在 图 17-2 的 有 下 图 选用 了 一 
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32 和 4 时 取 值 二 在 其 他 情况 均 取 值 0. 


按照 沃 尔 夫 勒 姆 的 观点 ， 众 多 (也 许 所 有 ) 的 元 胞 目 束 机 的 动 
力学 行为 可 归纳 成 数量 如 此 之 少 的 四 类 , 这 是 非常 有 意义 的 发 现 . 
它 反映 出 这 种 分 类 可 能 具有 某 种 普 适 性 .很 可 能 有 许多 物理 系统 
或 生命 系统 可 以 按 这 样 的 分 类 方法 来 研究 ， 尽 管 在 细节 上 可 以 不 
E, 但 每 一 类 中 的 行为 在 定性 上 是 相同 的 。 关于 分 类 问题 的 重要 
研究 可 参看 [93] 中 的 论文 . 


317.5 ZRA 
cB B HALES ST. von Neumann) RBH, 
用 于 模拟 生命 系统 所 其 有 的 自 复 制 功能 (参见 [95]j)， 此 后 元 胞 身 
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动机 还 被 用 于 模拟 其 他 的 物 弄 系统 和 自然 现象 ， 虽 然 从 偏 微 分 方 
程 的 数值 计算 方法 可 以 生成 某 些 元 胞 由 动机， 但 有 很 多 元 胞 站 动 
机 看 来 并 不 一 定 是 其 个 连续 系统 的 离散 化 描述 . 由 于 7Y0 年 代 以 
来 动力 系统 理论 的 发 展 ， 沃 尔 夫 勒 姆 等 人 开始 将 动力 系统 方法 用 
于 元 胞 自动 机 的 研究 中 如 果 说 偏 微分 方程 是 空间 连续 、 时 间 连 
续 和 状态 连续 的 无 穷 维 动力 系统 的 数学 模型 ， 那 么 元 胞 自动 机 则 
是 另 一 类 完全 离散 化 的 无 穷 维 动力 系统 .它们 二 者 恰好 成 为 两 个 
极端 . | 

TE [59 HF RR AR Fe iy MY SS — TE ST Ote RUE XS $73 
用 于 研究 元 胞 自动 机 ，[93] 收集 了 到 1986 年 为 止 的 重要 论文 , 并 
附 有 大 量 计算 机 实验 的 结果 . [93] 是 1989 年 关于 元 胞 自动 机 的 
一 次 学 术 会 议 的 论文 集 ， 其 中 [96]、[971 对 于 计算 理论 和 形式 语 
言 在 元 胞 自动 机 中 的 研究 情况 作 了 综述 ， 

关于 元 臣 自 动机 前 计算 能 力 已 有 不 少 研究 ， 已 知 每 一 个 图 灵 
机 都 可 以 用 元 胞 自动 机 来 模拟 ， CAMA UR A CHE 
一 14) 的 通用 元 胞 自动 机 , 它 可 以 模拟 任 何 一 个 元 胞 自动 机 在 任何 
初始 构 形 时 开始 的 动力 学 行为 . 


$ 18 一 些 数学 记号 与 结果 


为 了 用 形式 语言 来 研究 元 胞 自动 机 ， 我 们 在 本 节 介 绍 必要 的 
一 些 数学 记号 ， 同 时 列举 有 关 的 一 些 基 本 结果 . 材料 主要 取 自 
[96] ~ [93]. 


$18.1 HHS SRRK 


记 访 为 个 符号 的 有 有 限 集 ， 2 为 整数 全 体 的 集 ， 利 用 集合 论 
We, WS’ 是 从 多 有 映射 到 5 的 映射 全 体 , 也 就 是 用 及 中 的 符号 组 
成 的 双 侧 无 限 的 符号 序列 的 全 体 ， 换 名 话说 ，8” 就 是 一 维 元 胞 自 
动机 的 构 形 全 体 所 成 的 集合 , 我 们 称 之 为 构 形 空间 ， 对 于 cc 8’, 
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与 上 节 一 样 记 为 
a= (12-2097), 
其 中 a, 的 位 置 即 是 基点 ， 今 后 常 称 5E 8" 是 ( 构 形 ) 空 间 中 的 点 。 
在 S^ 中 的 任意 两 点 = 和 4 之 间 引 入 距离 


dí(z, y)- PIC ya, 


ROLE ay Ri B(aiy 34) =O, 4 mAy BY D Co, y) =1, Ria, 在 
S^ 中 可 以 建立 起 开 、 闭 、 紧 等 等 拓扑 概念 ， 这 些 对 于 今后 的 研究 
是 必要 的 . 

在 85 上 定义 移 位 算 子 0 为 

a(t) = iii $€ Z, 
现在 定义 与 5 WY AE B5 AE 8E LR SM 
F, St? 87 
为 元 胞 自动 机 .这 里 了 与 o 可 交换 的 定义 是 了 sg 一 go 了 了 ,也 就 是 
对 每 个 E87 成 立 
F(o(2)) -o(F(2)). 

已 经 知道 ， 这 个 定义 与 上 一 节 中 的 定义 是 等 价 的 . 这 也 就 是 
说 , 对 于 与 o 可 交换 的 连续 映 射 ,一定 存在 7>0 AUR PRR S: 
S?11 — 9, 使 得 对 每 一 个 构 形 w= (oro t) BI GE Z, BSE 

Fo) flair oy Gy 77 Qe). 

Ej ja BE SAM, 我 们 称 也 为 元 胞 自动 机 的 全 局 映射 。 它 在 
今后 讨论 中 是 很 有 用 的 . 

对 于 多 维 元 胞 自动 机 也 有 类 似 的 结果 . 

取 S? pA FEAT OR, ME SR F(S^). 
BRA 

SRF (87), 
由 此 可 见 , 对 每 个 $220, 有 
FSD DFS), 
利用 这 样 的 单调 包含 关系 , 可 以 定义 ， 
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AVP) =Ñ FG, 
称 为 元 胞 自动 机 F 的 极限 集 ， 由 于 S7 在 引进 距离 之 后 是 紧 集 ， 
F 是 连续 映射 , 容易 证 明 4( 卫 ) 一 定 不 会 是 空 集 ， 
可 以 证 明 , 有 
lim d (F'(S*), A(F))=0, 


共 中 8(，，*) 蚌 两 个 集合 之 闻 的 有 距离。 这 个 关系 表明 , 有 意义 的 动 
力学 行为 在 A(F) 之 中 ， 
利用 定义 可 见 
F(ACF))CAG), 
BAP) FEER, KRE APRA FRR, 


§18.2 ET UG. AHAM 


考 虚 在 极限 集 4《F) 中 只 含 一 个 点 ( 即 构 形 ) 的 最 简单 情况 ， 
记 A(F) 一 {9}. AAF) F RRETA F) =g. BH 
Ii, A Foo —coF TUAR ACP) Be o AER, RIA Se ACP) 
Wd ol CAF). FREA) 只 食 一 个 构 形 9， Bit 
g= C-qg-:dogr), 可 见 每 个 9 都 相同 . 这 样 的 构 形 叫做 空间 平 
稳 构 形 , 记 为 

9 一 (…9994…)》， Ges, 

我 们 称 4( 了 ) 只 含 一 个 构 形 的 元 胞 自动 机 了 为 袜 零 型 元 胞 
自动 机 .上 面 已 经 证 明 , 这 个 构 形 一 定 是 空间 平稳 构 形 ， 下 面 将 
SEW, 这 类 元 胞 自动 机 的 动力 学 行为 即 是 在 $17.4 中 的 第 一 类 
行为 . 

可 以 证 明 , ACP) — (9E 的 充分 必要 条 件 是 ， 从 任何 一 个 构 形 
e€ S7 HK, FFE n, Ht F^(0) — q. 这 里 的 和 可 以 与 有关. 还 可 以 
WHA, ACP) 一 {q} 的 充分 必要 条 件 是 , 存在 加 使 FY(S?) 一 {9}， 
这 等 于 是 说 , 对 每 个 构 形 eC 87, FETAR N, AE FCO) =g 
对 一 切 c 同时 成 立 . 
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用 动力 系统 的 语言 来 说 , FR ST SL e A E A. 
它 有 一 个 全 局 稳定 的 不 动 点 {9}。 所 有 轨道 在 有 限时 间 内 就 直接 
落 到 这 个 不 动 点 上 .整个 空间 S 在 有 限时 间 内 收缩 到 这 个 点 上 . 
ASR WG, 这 个 不 动 点 本 身 还 具有 在 空间 上 最为 简单 的 平稳 结构 . 

以 上 内 容 可 参看 [98] 或 其 他 文献 . 在 论文 [99] 中 证 明 , 一 维 
元 胞 自动 机 是 否 为 寡 零 型 帮 是 一 个 不 可 判定 问题 . 这 就 是 说 ,不 
存在 一 个 算法 , 它 关 于 任何 一 个 一 维 元 胞 自动 机 , 都 能 够 对 这 个 元 
胞 自动 机 是 否 是 苦 零 型 的 问题 给 出 “是 或“ 否 的 回答 ， 


$18.3 4( 本 为 无 限 集 的 情况 


这 里 叙述 并 证 明 关于 极限 集 (五) 的 一 个 基本 结果 如果 也 
不 是 里 零 型 元 胞 自动 机 , 那么 (了 ) 为 无 限 集 .， WAS, APA 
只 含 一 个 点 时 就 一 定 售 元 限 个 点 ， 没 有 其 他 可 能 性 . 利用 ACP) 
为 移 位 不 变 集 , 具 要 找 一 个 zE€ AP), ERATA EZ, ofc) 都 
各 不 相同 , 这 样 就 已 找到 了 ACF) 中 的 无 限 多 个 点 . 

Moe MATT, WEN ij, RE o (2) —o'(2), MA n fe 
双 伍 无限 的 周期 符号 序列 我们 称 这 样 的 > 为 空间 周期 构 形 ， 在 
上 一 小 节 中 所 讲 的 空间 平稳 构 形 基 它 的 特例 , 这 时 则 期 等 于 1. 注 
意 这 里 是 关于 57 中 点 的 铺 构 的 概念 , 它 与 动力 系统 中 的 时 间 周 期 
概念 全 然 不 同 . 

Wika yEACF), Hory. 如 果 在 + 与 9 中 已 经 有 一 个 不 是 
空间 周期 构 形 , 那么 它 就 是 上 面 所 需要 的 z. 

现 设 w 和 yw 都 是 空间 周期 构 形 、 不 妨 设 2 和 yy 有 相同 的 空间 
周期 ( 香 则 取 它们 的 公 倍 数 ), id 

ey TA gs («imb ue), 
Hope fests, ug UAUWBTGIEC^AA4BSPR—T89 
d ort HU 2—0 的 基点 位 置 从 esu AM wA, 但 这 里 不 排除 
w 和 % 在 循环 移 位 下 可 以 重合 。 MRA, Mo 和 2 只 相差 某 个 
空间 移 位 , 
tét 


定义 在 S" 中 的 一 个 集合 
Nw= (Cross) |w ew}, 
其 中 的 构 形 在 基点 左 方 与 z 相同 ， 而 在 基点 右 方 长 度 为 wp mo 
Fj w IER. 
按照 ST 中 的 距离 拓扑 , No 是 闭 集 ， 同 时 可 以 看 出 , Ne 
不 含有 任何 空间 周期 构 形 ， 于 是 , 只 需要 证 明 
N NAPS, 
由 于 ACA) e (FT), RENEA i0 VEHI 
ND FG?) * 9. 
利用 对 每 个 0 3$ e € FS?) ju y c F'CG97), 可 以 将 它们 的 
原 象 适当 拼接 起 来 , 找到 一 个 2E PS"), CRAB 
g — (e WWS SU 7), 
其 中 slsa…s 是 某 个 符号 串 , KE 
n=2éir|w| (=2¢r|v]), 
7 为 局 部 映射 了 的 邻 域 半径 , |w| — ol few df v BAKE, Blo 
与 y 的 空间 周期 ， 可 看 出 z 的 某 个 移 位 o (€ Nu. BT F'OS?) 
也 是 移 位 不 变 集 , 因此 也 成 立 oe) CFCS?) WESS, 
从 今后 的 例子 可 知 , 在 ACE) 为 无 限 集 时 ， 它 可 以 是 可 列 集 ， 
也 可 以 是 不 可 列 集 ， 


$18.4 周期 点 集合 


id Per(F) H zu B SELF. 的 周期 点 集合 .在 Per PA GRE 
集 时 则 考虑 其 闭 包 w CP). 

容易 证 明 , AA Pert D, MER P- EREZA 
周期 点 ， 注 意 ， 在 未 加 说 明 时 凡 提 到 周期 概念 总 是 指 时 间 上 的 周 
期 行为 ， 

任 取 一 个 空间 平稳 构 形 o 为 初始 点 ， ABP Ce, Fc), s 
F"(0),…)。 从 局 部 映射 可 以 看 出 , 每 个 FQ) (27 1) ERE RUE 
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RHE. KA SHARIR, Mike FP (o), ce, Fe) PRD 
有 两 个 相同 , XH kee SAMS TM. 这 样 就 已 经 在 C6. 了 (0)、 
… PY-+(0) 中 找到 了 周期 点 , 而 且 其 周期 不 超过 A. 

如 果 从 一 个 空间 周期 为 2 的 初始 构 形 o 出 发 ， 那 么 情况 也 是 
类 似 的 ， 这 时 每 个 Fe) (9270) 的 空间 周期 都 是 2, 而 长 度 为 的 
不 同 符号 串 上 只 有 如 个， 因此 从 o 击发 的 轨 必 是 周期 轨 或 终极 周 
期 胃 ， 这 样 也 可 找到 周期 不 超过 如 的 周期 点 . 

但 是 以 上 推论 并 未 表明 元 胞 自动 机 一 定 有 很 多 周期 点 ， 在 
$ 18.2 中 的 瞻 零 型 元 胞 自动 机 也 的 周期 点 集 为 

Por(#) = A(F)={g}, 

即 只 有 唯一 的 一 个 周期 为 1 的 不 动 点 ， 我们 已 经 知道 , 9 的 空间 
周期 也 是 1, 即 有 og) 一 g. 

更 为 突出 的 是 在 [98] 中 举 了 一 个 例子 , 它 的 周期 点 集 Per(F) 
也 只 有 一 个 不 动 点 ;同时 9 也 是 空间 平稳 构 形 , 但 这 时 的 极限 集 
ACP)RS Sigh. HAA § 18.3, 这 时 的 ACA ARE., 在 [98] 
指出 , 这 个 元 胞 自动 机 具有 复杂 的 动力 学 行为 . 

这 里 的 情况 与 单 峰 映 射 大 不 一 样 ， 一 个 单 峰 映射 如 果 只 存在 
一 个 不 动 点 , 同时 不 存在 任何 其 他 周期 轨 的 话 , 则 它 的 动力 学 行为 
是 极其 简单 的 ， 在 §18 定义 的 增长 数 s 也 是 周期 为 ® 的 周期 点 
个 数 卫 ,的 增长 数 . 对 于 其 他 低 维 动力 系统 情况 也 是 如 此 . 因此 在 
[98] 中 的 例子 是 非 平凡 的 . 由 于 这 个 例子 相当 复杂 , 本 书 从 略 . 

除了 ACF) fI PerCF) GX al F)) 这 两 个 不 变 集 之 外 ， 从 动力 
系统 的 观点 来 看 还 可 以 研究 FARR OP). RRA 
参看 [87] 中 的 一 般 性 介绍 ， 明 显 有 包含 关系 

rwFIEABF)ECACF), 

已 经 知道 , 其 中 每 一 个 包含 都 可 以 是 真 包含 . 


$18.5 ACF) P i 69 3E 9 4 
设 o ACE), IK ACFYAHESERIAL M o HR SER TE 
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ACF, ROA, TRAP 的 定义 ， 它 是 单调 下 降 的 集合 
序列 LESE) ho 的 交 , 因此 对 每 个 620, A oC FCS). ATF 
Và] dij 4 4270, 存在 点 0-1, 使 F* (02) =e. 
可 以 将 这 个 事实 加 强 为 : 在 A(F) 中 存在 一 个 点 序列 {e-h 
使 Co — €, 且 对 每 个 $218 
EF (eni) = 0-141, 
虽然 映射 F, Sz-> 8Sz 


AR is Hy PT ER S, 但 可 以 将 上 述 点 序列 {fe-tjee 看 成 点 的 逆向 
BL SF OL). 换 句 话说 , Sec ACE) it, RIA e d REPE VUE 
妊 ( 歼 ?中 ,而且 也 存在 一 条 负 半 轨 完 全 在 ACP) 中 . 这 个 结果 有 了 时 
是 很 有 用 的 . 
为 此 只 要 证 明 , 对 eC ACP), 在 在 一 个 点 ce-1EACF), 使 
F(0.3)—c, 


首先 , 从 eC F^(ST)xEBgA nO 成 立 , WRAY a. € 87, F(a.) 
=0 > 
b,= E77 (a, 
3A Fb) o, AAS? AAR, 存在 收敛 子 列 bnt. PRR 
* b, WE 
lim ba 6, 
M Fb, — o PA kooo, AA F WERE, RIGA F(b)-—0, EJ 
下 证 明 这 个 BE AP), 因此 它 即 是 所 要 求 的 o_x。 
对 每 个 大 有 CF"). GRE LPS?) hioo 的 单调 下 降 
性 质 和 各 o0, XE 6,204 k 充分 大 时 就 有 
b, E FCS), 
4 &oo, WARE oe RS), wT ¢ 的 Hi 意 性 ， 得 到 5 
EAC), 
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819 元 胞 自动 机 中 的 正规 语言 


本 节 将 证 明 , 对 每 个 和 >0， 取 FCS) AY BAAD 
形式 语言 总 是 正规 语言 .讨论 了 几 个 初等 元 胞 自动 机 的 极限 语言 . 
本 节 材 料 主 要 取 自 [58]. | 


$19.1 FS4) 的 复杂 性 


， ”现在 应 用 形式 语言 工具 来 研究 了 C5) 的 复杂 性 ， 由 于 每 个 构 
形 是 双 仙 无 限 的 符号 序列 , 采取 与 86 中 相同 的 方法 ， 即 从 每 个 将 
形 取 它 的 所 有 有 限 子 串 , 将 这 样 得 到 的 子 串 全 体 作 为 研究 的 对 象 ， 
将 这 个 过 程 记 为 算 子 和 ,那么 有 < 和 432) 一 六 相仿 地 ， 使 用 记号 
LE), LORS?) SS. WH, RINK LAP) A F W 
极限 集 语言 . 

现在 证 明 ZF RERE. ERMA [53] 中 的 处 理 
方法 ， 关 于 这 方面 的 其 他 研究 方法 , 可 参看 [97]。 在 数学 上 的 严 
格 证 明 见 [100]. 


图 19-1 


DES 17-1 中 的 76 号 初等 元 胞 自动 机 为 例 来 讨论 . 在 图 19-1 
上 有 四 个 结 点 ， 分 别 代表 00、01、10 fü 11, We ith AES 9L a 
Eph 76 号 规则 中 的 内 容 ， 举 例 来 说 , 从 标 以 01 的 结 点 出 发 , 根据 
规则 中 的 011—1, 38 — s LA TES LB EA 01 38 T] s VA. 11 WY 
结 点 .又 根据 规则 010— 1, Uf — Ate 1 R9 AGA EE PS EL 10 的 


结 点 ， 一 般 而 言 , 从 规则 
ait = f(a Osa ) 
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出 发 ， 从 标 以 aiiai 的 结 点 有 一 条 标 以 ai 的 缴 通 启 标 以 Bia 
的 结 点 . 

在 六 "中 的 任何 一 个 符号 圳 对 应 于 图 19-1 中 的 一 A RH. 例 
如 , 00101 € S* 对 应 于 

00 —> 01 — 10 — 01, 

同时 , Sop = de IOS FANA 010, 即 是 在 语言 PPS") PR 
-TRER PE, 在 语言 LOPS) 中 的 每 一 个 字 对 应 于 图 中 
的 一 个 路 径 .其 中 结 点 标号 所 成 的 序列 在 去 掉 重 复出 现 符号 后 , BB 
ELS?) S* 中 的 字 ， 而 弧 的 标号 所 成 的 序列 即 是 CF C7) 
"PESE. 

现在 容易 证 明 LCS?) ERIE A. AE 19-1 为 例 来 
说 明 这 一 点 . 虽然 这 个 有 向 图 不 是 在 本 书 $ 工 中 介绍 的 有 限 自 动 
机 ， 但 只 要 以 图 堆 -1 为 基础 ， 略 加 修改 就 可 以 得 到 接受 
了 (BCS?)) 的 一 个 有 限 自 动机 .实际 上 ， 只 要 加 入 一 个 代表 初 态 
的 结 点 , 并 用 带 e 转移 的 弧 通 向 原 有 的 每 一 个 结 点 , 再 将 每 个 结 点 
定义 为 终 下 状态 ， 就 得 到 在 81.3 中 的 带 s 转移 的 非 确定 性 有 限 
自动 机 , 它 所 接受 的 语言 就 是 COPS"), 

上 述 方法 不 仅 证 明了 每 一 个 (了 US?)) 是 正规 语言 ， 而 且 可 
以 推广 到 证 明 每 一 个 CCS?) HERI, din i20 JE E 
Xi Suid. 

如 果 将 初始 时 刻 的 语言 CS") = 8* 看 成 是 没有 任何 结构 的 
语言 , 那么 从 包含 关系 

S723F(S*)aFW(Ss?*y-l.-. 
可 以 看 出 也 有 
A (82) 2 4 F(89)) ZEX). 
因此 可 以 设想 , 虽然 对 每 个 4 之 0， SZ CP'(GI)) ROGERUS R, 但 随 着 
4 的 增加 CE CS7)) 可 能 会 形成 越 来 越 复杂 的 结构 ， 又 可 以 设 
想 , 如 困 按 照 关 于 正规 语言 的 某 种 复杂 性 刻 刘 , AE) 的 复 
杂 程 度 增 长 很 快 的 话 , 那么 极限 集 语言 
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SC) 

很 有 可 能 是 非 正规 语言 。 在 [53] 中 用 大 量 的 计算 机 实验 证 实 了 对 
茶 些 元 胞 自动 机 来 说 ,以 上 设想 是 正确 的 , 或 者 很 可 能 是 正确 的 . 
但 在 这 方面 还 缺乏 严格 的 数学 论证 . 


§19.2 最 小 有 限 自动 机 


在 [53] 中 对 于 正规 语言 CPS") ) G20) 的 复杂 性 刻 划 提 
出 了 几 种 方法 ， 接 受 它 的 最 小 有 限 自动 机 的 结 点 个 数 ( 即 状态 个 
数 ), SA SRE. 在 本 小 节 中 我 们 讨论 其 中 的 
第 一 种 方法 . | 

首先 要 指出 , 不 论 是 LPS?) ) (90) EE CACPY) 都 县 
有 在 87.4 中 的 两 个 基本 人 性质， 因此 都 属于 在 $15,1 中 所 定义 的 
DEBE. 这 里 对 于 57.4 中 的 性 质 2 还 可 以 补充 要 求 ， 对 任何 
Sel, FEES, Rael, 实际 上 ， 这 对 于 LCKS) 也 成 立 ， 
HER 4 一 0 RIT, 

利用 人 $ 8.1 中 的 讨论 , 可 见 接受 语言 CF (G?T)) 的 最 小 有 限 
自动 机 只 有 一 个 非 终止 状态 ， 它 对 应 于 语言 的 补 集合 . 因此 可 以 
理解 , 在 [53] 中 计算 接受 OOPS") WBA PL RAT 
BIN — BRT AR PEBILRA, ERARE A EUIS HE UL 
RAXSHI. 但 在 本 书 中 仍 采 取 与 前 面 章节 中 统一 的 记号 和 作 图 
规则 . 

按照 [58]， 采 取 以 下 两 个 步 又 即 可 求 出 最 小 有 限 自 动机 ， 实 
际 上 ,这 与 在 [ 英 中 介绍 的 一 般 方法 完全 相同 ， 下 面 以 图 19-1 为 
例 作 介绍 . 

第 一 步 是 消除 自动 机 中 的 非 确 定性 ， 将 更 个 结 点 记 为 wo, u 
wz Hue, 其 中 下 标 值 即 是 原 有 标号 的 二 和 进 制 数值 . 然后 取 iuo, wm 
Ua, Ws} 的 所 有 子 集 , 包括 它 自身 和 空 集 在 内 ， 共 有 16 个 子 集 ， 将 
每 一 个 子 集 作为 一 个 结 点 ， 然 后 从 每 个 结 点 引出 标 以 符号 各 1 
HARM, EMT A AB 19-1 决定 ， 采 用 51.6 中 
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的 右 线性 语法 的 记 法 , 例如 第 一 条 规则 为 
(uo, Ui, Uo, Va) 一 Oiuo, Ua, Us}, 
因为 从 四 个 结 点 出 发 沿 着 标 以 0 PRESTA BU Ay wo. ua 
us, 但 不 能 到 wi. , 
WS Fy BAH, (uo, wa, ua, Ua} 是 我 们 要 求 的 确定 性 有 限 自动 机 
的 初始 状态 ， 因为 它 包含 了 所 有 可 能 的 四 个 状态 。 从 上 述 第 一 条 
规则 继续 做 下 去 , 可 以 得 到 
luo; wa, us) — lus, ust, 
(us, ust 一 Ouo, vi, tsh, 
{up, wa, Us, tz} —> lius, us}, 
iuo, Ux, Ue} —> Oto, Ua, ws), 
ius, us} — lius), 
{uzy > Oiug, ws}, 
{uplift } G }=), 
(uo, uit > Oflu, t}, 
(uo, it —> 1 {ue, ra}, 
以 上 十 条 规则 已 是 所 需 的 全 部 信息 我们 实际 上 只 用 了 苔 个 子 
集中 的 6 个， 将 { C=O) ROE ALAS, 其 他 均 为 终止 态 , 就 
1 可 以 得 到 图 19-2 rf ipf E ELS BL 其 中 
5 个 黑 圆 点 代表 五 个 终止 态 ， 按 从 左 到 
5 D 右 的 顺序 为 Tuo, i, a, ts} (uo, Ua 
us}, iua. wal. (us) 和 duo, wa}. 
但 这 并 不 是 最 小 有 限 由 动机 .在 中] 
中 介绍 了 这 方面 的 一 般 算 法 .下面 以 等 价 关系 Bi AM FH RH 
罗 德 定理 为 工具 ， 说 明 对 上 县 体 的 问题 如 何在 图 上 进行 澡 作 (参见 
§ 9.1 中 的 讨论 ). 
利用 在 $9.1 中 的 命题 : 
Ht GES, caR ya = vcBy, 
就 可 以 将 图 19-2 中 的 第 一 个 结 点 和 第 二 个 结 点 合并 ， 实 际 上 , 从 
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1 


图 19-2 


两 个 结 点 出 发 漂 着 标 以 0 的 弧 都 到 达 第 二 个 结 点 ， 耐 洛 着 标 以 
1 的 弧 则 都 到 达 第 三 个 结 点 . 因此 知道 , 由 这 两 个 结 点 所 代表 的 
TS BAUER, 等 价 的 , 即 可 以 合并 . 这样 就 得 到 图 19-3. 实际 
E 这 里 的 初 态 与 从 左 方 数 起 的 第 四 个 结 点 可 以 合并 ， 用 数学 语言 
可 以 写成 下 列 命题 : 
wiRryl, c0R,2, yORLY > sRry. 
这 个 合并 之 后 得 到 图 19-4, 它 已 是 最 小 有 限 自 动机 ， 这 只 要 反复 
利用 以 下 两 个 事实 即 可 证 明 : 
wE L, yc L > wRiYg AMY. 
oR yy ARAL, waa, ya=y => 2’ Riy ARI. 


0 0 
i tifo (Ji 1.1 
6 

1 $ 
图 19-3 图 19-4 


Ze [92] 的 附录 ( 表 10) 中 对 于 256 种 初等 元 胞 自动 机 (E 2, 
r=1), HET i 从 工 到 5 时 的 语言 和 (848S2)) 的 最 小 有 限 H 3) 
机 的 结 点 个 数 ， 并 将 这 个 指标 称 为 正规 语言 的 复杂 性 .。 其 中 有 一 
部 分 元 胞 自动 机 的 这 个 指标 在 纪 增 加 时 明显 有 指数 增长 速 诬 ， 这 
强烈 地 暗示 它们 的 极限 集 语言 AF) 为 非 正规 语言 ， 但 至 今 
尚 无 严格 证 明 . 


8 19.3 76 号 元 胞 自动 机 


由 于 在 元 胞 自动 机 中 的 语言 CPG) GS) A CACE)) 
HE DZER, 我 们 可 以 将 $ 15.1 中 的 禁止 字 概 念 用 到 这 里 来 . 
从 图 19-4 直接 可 以 看 出 ,76 号 元 胸 自 动机 的 语言 (FCS”)) 只 
有 唯一 的 一 个 禁止 字 Tli, 
另 一 方面 ， 从 图 i7-1 Wy GL, 76 号 元 胞 自动 机 的 局 部 规 册 中 ， 
只 要 wa mian DÆ IL, MA ata, A, AAS ^ di dd 
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等 映射 ,但 P 作用 于 FCS?) ESR, 于 是 , 就 得 到 
F(S?*-Fr(s^5, >l, 

并 且 也 有 A(F)= F(S?), 
因此 76 号 元 胞 自动 机 的 极限 集 语言 是 正规 语言 , 它 的 最 小 有 限 自 
动机 即 是 图 19—4 所 示 的 结果 . 加 顾 图 17-2 中 176 号 的 计算 机 实 
验 , 可 以 看 出 情况 确实 是 如 此 . 虽然 在 1 一 0 时 刻 的 初始 构 形 是 随 
机 选择 的 , 但 从 #=1 开始 , 图 形 不 会 变化 ， 当 然 , 各 次 实验 所 得 的 
结果 与 初始 构 形 有 关 ， 

从 动力 系统 的 角度 来 看 ,问题 非常 简单 .每 一 个 不 合子 串 11i 
的 构 形 都 是 不 动 点 .任何 其 他 点 出 发 的 轨 在 一 次 选 代 后 就 落 到 某 
一 不 动 点 上 . 例如 , 在 $ 12.4 8814.4 POE HER F 当 参 数 
值 s= 时 就 是 如 此 .76 号 元 胞 自动 机 在 沃 尔 夫 勤 姆 的 分 类 中 赂 
于 第 二 类 . 


819.4 128 号 元 胞 自动 机 


这 时 的 局 部 规则 将 111 映 到 d, 而 将 其 余 喘 到 0， 在 图 17-2 
中 画册 了 它 的 计算 机 实验 结果 ， 在 很 少 几 次 选 代 之 后 就 得 到 完全 
由 符号 0 组 成 的 袍 形 . 从 表面 上 看 似乎 是 属于 沃 尔 夫 勒 姆 分 类 中 
的 第 一 类 .下 面 将 要 证 明 ， 如 果 将 第 一 类 行为 等 同 于 在 18.2 p 
的 罕 零 型 元 胞 自动 机 , 那么 128 号 并 不 属于 这 一 类 . 

实际 上 , 分 别 由 符号 0 和 1 组 成 的 空间 平稳 构 形 都 是 了 的 不 
动 点 .因此 在 极限 集 AP) 中 至 少 含 这 两 个 点 。 8 818.9 可见， 
(了 F) 为 无 限 集 ， 我 们 将 在 下 面 对 此 作出 全 面 的 分 析 . 

从 动力 系统 的 角度 来 看 ， 可 以 认为 128 号 元 胞 自动 机 有 一 个 
吸引 不 动 点 , 即 全 0B, 又 有 一 个 排斥 不 动 点 ， 即 全 1 串 .， 极限 集 
不 (将 ) 由 这 两 个 不 动 点 和 连接 它们 的 无 限 多 条 蜡 宿 轨 道 组 成 ， 其 
体 分 析 如 下 . 

在 图 19-5 中 作出 了 接受 ZF) PE) 和 
人 2(A(F)) 的 最 小 有 限 自动 机 ， 对 于 (BCS?))， 只 有 两 个 禁止 

i70 


字 : 101 与 4001， 对 于 (8?(S?)), 则 有 四 个 禁止 字 : 101, 1< 
n<4， 胃 归纳 法 容易 证 明 ， 对 于 V OP(G^), dp 2» + RL: 
10"1, i1<n< 3% 它们 都 是 有 限 补 语言 . ii 

接受 语言 多 (A( 了 )) 的 最 小 有 限 自动 机 
只 有 四 个 状态 ， 它 的 复杂 性 在 于 这 时 有 无 限 Sig 87 
多 个 禁止 字 ， 如 记 工 --2(A(F)), Wik sm | 


$15.1 中 的 记号 , Sp SR ane i7, 
LY = (10*1|nz»1]. Oo of 
语言 名 (A(F)) 为 无 限 补 语言 . t 
从 图 19-5 HR ARH LAP) gaco 


正规 表达 式 为 
S/(ACP)) -0*170*. D-O-O- 


这 表明 , HEM ACF) PH, 除了 全 0 图 19-5 
ASL Eh, 其 中 出 现 的 符号 荆 必 须 连接 成 -- 个 串 ， 容易 理 
解 , 这 些 都 是 游荡 点 ， 这 时 
Per(F) - QC?) - (0, THE ACF), 

容易 直接 验证 在 §18.5 的 命题 ， 即 对 每 个 eE ACE), dx 
Bre 出 发 的 正 半 轨 在 4(P) 中 ， 同 时 存在 按 $ 18.5 意义 下 的 一 条 
负 于 轨 也 在 ACP)np. 

最 后 , 容易 说 明 为 什么 在 实验 中 ， 对 128 号 元 胞 自动 机 来 说 ， 
从 随机 的 初始 构 形 出 发 总 能 很 快 就 收 伊 到 全 零 串 ， 实际 上 ,如 在 
Fi(0) 中 含有 一 个 符号 1， 则 在 6。 中 至 少 要 有 器 +1 个 I， 对 于 用 
N 个 元 胞 和 周期 边界 条 件 的 计算 机 实验 来 说 , 如 果 4> /2 则 等 
FERN 个 元 胞 的 初 态 全 是 1， 由 于 初始 构 形 是 随机 选取 的 ， 因 
此 取 到 这 种 初始 构 形 的 往 率 为 2”。 当 很 大 时 ,实际 上 是 不 可 
能 出 现 的 . 


$19.5 90 号 元 胞 自动 机 


从 计算 机 实验 中 明显 可 见 它 的 动力 学 行为 属于 第 三 类 ， 但 是 
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从 90 与 元 胞 自动 机 的 局 部 规则 为 ; 

111—>0，110->1l，101->0，100->1, 

0iil—1, 010-0, 001-51, 000->0, 
可 以 看 出 有 

FCS”) =§?, 
FE SRS LA. Reh, - MPR REAR 
whit ait = flea, ai aa P. WP RT oz 为 单 射 ， 或 关于 
dia 为 单 射 ， 就 成 立 了 LS?) 一 S2。 从 图 19-1 来 说 明 这 一 点 是 很 
直观 的 .这 时 从 每 个 结 点 出 发 (或 进入 每 个 结 点 ) 的 两 条 强 分 别 标 
以 符号 0 和 1， 从 而 就 保证 了 在 了 了 (S) 中 出 现任 何 构 形 . 
这 表明 研究 AF) UREE ZAE 的 方法 所 具有 的 局 限 
性 ，ACF) 是 五 的 最 大 不 变 集 ， 它 本 身 不 一 定 能 够 反映 了 在 
(了) 上 的 复杂 动力 学 行为 .在 玉 为 满 射 时 这 是 非常 明显 的 事实 ， 
打 个 比方 来 说 , 在 二 次 方 映射 为 满 射 的 情况 ， 即 f(o) — 42(1—2), 
这 时 的 最 大 不 变 集 为 区 闻 了 = [0, AB. 仅仅 这 一 点 不 能 说 明 
什么 问题 . 
规则 90 号 是 可 加 元 胞 自动 机 的 一 个 例子 , 这 时 即 为 

f(aia, ir 0) = Giit Ges mod 2, 
这 方面 已 有 很 多 研究 .在 周期 边界 条 件 下 可 以 用 代数 方法 求解 ( 见 
[101], RED, 在 初始 构 形 只 含有 限 个 符号 1 的 条 件 下 ,90 号 
元 胞 自动 机 的 每 一 个 元 胞 的 状态 变化 序列 {9 中 ,>o, 除了 一 种 平凡 
情况 外 , 一 定 是 非 周 期 的 ， 这 揭示 了 90 号 的 混沌 行为 前 一 个 方面 
(28 [102]). 在 本 书 $ 21.8 中 将 计算 90 号 元 胞 自动 机 的 拓扑 
fH, 说 明 它 与 二 次 方 映 射 中 的 满 射 情况 有 一 个 相似 之 处 , BES 
都 达到 极 大 . 


819.6 18 5522 5$ je 5 x 


在 图 17-2 中 画 出 了 这 两 个 元 了 胞 自动 机 的 实验 结果 ， 图 19-6 
E FX18 号 元 胞 自动 机 时 , ERES AE) HRD AR 
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HII. Eee LL TIAL, Xe LFE 
一 个 无 眼 补正 规 语言 . 它 的 禁止 字 集合 可 用 正规 表达 式 表 未 为 
L" -11(0*10*1)*1, 


其 中 0+ —00*, GIN M ae 
XT 18 号 元 胞 自动 机 来 说 , 用 接受 MN 

LEMS") 的 最 小 有 限 自动 机 的 结 点 个 

数 来 刻 划 的 正规 语言 复杂 性 如 下 :5 二 1 a 


时 为 6( 邮 图 19-6), ¢=2 fy 48, $—9 时 为 144, $=4 时 合计 已 
大 于 20000， 因 此 可 以 推测 , 语言 .C4CF)) 不 是 正规 语言 、 但 至 
今 尚 无 证 明 . 

可 以 建立 在 18 号 与 90 号 元 胞 自动 机 之 间 的 一 个 联系 ， 如 果 
只 考虑 由 00 和 01 组 成 的 构 形 , 并 且 令 00->0,01->1, 那么 18 号 
的 两 次 选 代 愉 好 模拟 了 90 号 的 一 次 达 代 ， 从 90 号 具有 性 质 

而 085) 一 85 

可 以 推 知 , 在 18 号 元 胞 自动 机 的 极限 集 4CF) 中 ， 至 少 含有 所 有朋 
TETP 11 的 构 形 全 体 ， 

关于 22 号 元 胞 自动 机 也 有 类 似 情 况 ， 当 五 为 22 号 时 , 语言 
SA CFP(7)) 的 正规 语言 复杂 性 在 名 = 工时 已 为 16, 也 就 是 说 与 图 
19-2 对 应 的 那个 确定 性 有 限 自 动机 已 含 15 个 终止 状态 ， 而 且 它 
已 是 最 小 有 腿 自 动机 .在 一 2 时 为 281, #i=3 时 为 全 07， 在 1 
—4 时 估计 已 大 于 20000, 

同样 , 如 令 0000— 0, 0001 — 1, M 22 E BOTE GE THER 
gl 90 S 8)— Uk. 

18 231022 号 元 胞 自动 机 的 材料 很 多 ， 除 了 [92]、[93], 还 可 
参看 [4 等 ,但 尚未 得 到 完整 的 结果 


$20 元 胞 自动 机 中 的 非 正规 语言 


虽然 关于 初等 元 胞 自动 机 中 可 能 出 现 非 正规 语言 的 猜测 没有 
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得 到 煞 学 上 的 证 明 或 否定 ， 但 在 元 忠和 让 动机 中 的 非 正规 语言 方面 
还 是 取得 了 不 少 成 果 ， 本 节 材 料 主要 取 自 [103]. [104], 


$20.1 WAAR 


上 面 已 经 提 到 , 有 大 量 的 计算 机 实验 使 我 们 有 理由 猜测 , 很 多 
元 胞 自动 机 的 极限 集 语 言 为 非 正 规 语言 . 这 也 就 是 说 , 它们 的 极 
限 集 具有 较 高 程度 的 复杂 性 表 20.1 列 出 了 在 合法 完全 的 元 胞 
自动 机 中 ， 四 类 不 同 的 动力 学 行为 所 占 的 大 致 比例 (此 表 取 自 
f92] )， 这 里 关于 合法 和 完全 的 定义 见 $ 17.2. 如 817.4 所 说 ,在 
k=2 和 ?一 工 的 初等 元 胞 自动 机 中 不 出 现 第 四 类 动力 学 行为 . X 
于 分 类 问题 可 看 [961 以 及 在 论文 集 [931 中 的 其 他 论文 . 


$ 20.1 


从 §19.5 已 经 看 到 , 如 果 ARAR, ME 仍 可 以 有 复杂 
的 动力 学 行为 ， 但 当 LAP) 为 一 个 比较 复杂 的 语言 时 ， 则 从 
AQ) RE X 
A(F) = ( FXS*) 
和 性 质 
lim d P(85), ACP)) -0, 

可 以 推测 相应 的 元 网 外 动机 了 会 有 复杂 的 动力 学 行为 

直到 目前 为 止 , 据 作 者 雇 知 还 没有 对 于 表 20.1 中 的 任何 一 个 
具有 第 三 或 第 四 类 动力 学 行为 的 元 胞 自动 机 ， 作 了 出 ZUE) 
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非 正规 语言 的 数学 证 明 . 
TEANAL. P. Hurd) 的 一 些 结果 


§20.2 LAP) ALF RAKE HF 


WU—4 EFF X6 XS A {O10 |nS0} 为 基础 ( 见 $d.7 与 
§3.2)， 可 以 构造 出 一 个 x=6 A r-2 的 元 胞 让 动机 使 
ZOAGP)YN ETC AX A, 但 不 是 正规 语言 

A k= 6 的 符号 集 

8-10, W, r, R, t, D}, 
RHEE r=2, 并 给 定 以 下 局 部 规则 

1. W..—W, 

2. .. RW. — 1, 

3. RW Lh: >r, 

4. rey.  rT(*-W, s yXl D), 
D. «Roy: > RlatW, cl. D), 
6. :of > l(y tW, s yr B), 
7. -ayL- — L(ys&W, o, yr, R), 

8. ERM 一 0. 

在 以 上 规则 中 , 记号 “代表 站 中 的 任何 符号 . Sb, 如果 同 时 可 
以 应 用 一 条 以 上 的 规则 , 则 按 上 述 顺序 在 先 者 为 优先 . 

容易 解释 上 述 定义 的 物理 意义 ,将 入 中 除了 符号 0 之 外 的 五 
个 符号 设想 为 在 直线 工 的 五 种 粒子 , 它们 的 位 置 均 在 整数 点 处 . 符 
号 0 扰 表 不 被 上 上 述 粒子 占有 的 位 置 . W 代表 不 移动 的 粒子 . L 
? 代表 向 左 移动 的 两 种 粒子 , BR 和 7 代表 向 右 移 动 的 两 种 粒子 . 它 
们 的 速度 均 为 每 个 单位 时 间 移 动 一 个 单位 距离 ， 即 相 邻 整数 点 之 
ERER. AN 2~8 RR Bae Fie AR), 但 有 一 
个 特殊 情况 ， 即 当 RAL RSA MARAE) SW 粒子 相 撞 
时 , 则 总 粒子 变 为 了 粒子 , 而 上 粒子 变 为 7 粒子， 图 20-1 蚌 对 这 
些 规则 的 一 个 说 明 . 其 中 空格 均 由 符号 0 DA, DEH, 
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现在 将 上 述 元 胞 上 自动 机 (的 全 局 观 射 ) 记 为 F, aI A 
LAP )) = KiU Ks, 
其 中 Kai Al Ke 次 表达 式 为 ; 
Ki-(rd4- R4 0y(F--0)*(12- L--0y', 
Ks-Íí(r-MRa-O"QWO6r(4L-40) 16420), 
实际 上 , EREK: (oh KE, AAWIT S O BRUN ST 中 的 
一 个 构 形 , 容易 看 出 , Er $0, XXTPERUMDECR i KR, WU 
RT FQS?Typ, 这样 就 证 明了 


KELAR) — KiEy AQ). 
ri WR Wo vr 1 rLWmmSGMSE wW L 
Ww R W wW E L 
t} T m w EWL 
wW wW W i Wr 
W W wW i r 
20-1 


反之 ,对 于 A(F) 中 的 任 一 物 形 ， 如 含有 一 个 以 上 的 符号 W, 
则 从 $18.5 可 知 ,在 歼 与 璇 之 间 具 能 由 符号 0 来 填 满 。 也 就 是 
说 , 在 不 动 粒 子玉 之 间 的 任何 可 移动 粒子 不 可 能 无 限期 地 存活 下 
去 .对 于 (可 能 存在 的 ) 最 左 的 W 粒子 , 那么 在 它 的 左 方 可 以 有 ?7 
和 五 粒子 ， 同 样 对 于 (可 能 存在 的 ) 最 右 的 全 粒子 ， 在 它 的 右 方 
可 以 有 了 和 忆 粒 子 ， 以 上 情况 的 肉 一 可 能 例外 是 在 五 * rp pe ABS 
情况 , 即 在 42) 的 构 形 中 只 有 一 个 WRF, 在 它 的 左 方 有 一 个 ? 
粒子 , 右 方 有 一 个 人 粒子 , BAW 粒子 距离 相等 . 同样 利用 8 18.5 
可 知 这 样 的 构 形 在 ACP p ERER, 它 代表 了 在 前 述 特 殊 碰 擅 
之 后 的 情况 .这 样 我 们 就 知道 在 ACP) 中 没有 其 他 构 形 、 从 而 得 
BS ACP) Ka 和 五 s 的 并 的 结论 ， 

”由 于 Es 是 用 正规 表达 式 写 出 的 , 因此 是 正规 语言 .从 五 s 的 
表达 式 是 一 个 上 下 文 无 关 语言 (TWO [629) 与 正规 语言 连接 而 
成 , 可 知 Es, UR CAP) AR, 都 是 上 下 文 无 关 语 言 . 
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最 后 证 明 , .名 (M7)) 不 是 正规 语言 、 否 则 ， 
LACEY) NOW Or (10005 i0} 
WSK EWER T. TE, 


820.8 工 (4GD)) 为 上 下 文 有 关 语 言 的 例子 


利用 类 似 的 方法 , 作出 了 大 一 6 和 7 一 和 的 一 个 元 胞 自动 机 不， 
它 的 极限 集 语 言 外 (ACF)) 为 上 下 文 有 关 语 言 ， 但 不 是 上 下 文 无 
KAT. 以 下 简要 地 叙述 与 上 一 个 例子 的 不 同 之 处 . 
BA {abelir 为 上 下 文 有 关 语 言 ， 但 不 是 上 下 文 无 关 语 
言 ( 人 参见 883.3, $ 8.6 f 8 4.2), 
JOB ILES RES SR 
S={0, W, r, R, t, D}, 
但 这 时 ES LAIEBOR ECHO YO, mE r4 P4915 EU. 对 
于 特殊 情况 的 碰撞, 修改 为 
rrWi > LWrR, 
SCAM ORES LOLA, RIA r— 4, 其 体 的 局 部 映射 为 
Y: vy I 
2. rrW W---- — R, 
38. rW- >r, 
4 epr WU > L, 
B. seer Wil — l, 
6. --arbed-* — rae R, b W i L, esl b, d+ D), 
7. Habod- > Rater W i D, VW b, 
ont L, ds L), 
8. »-abelds> > dA b, eW r R, bc, R, oa), 
9. -:gbcáL:* > LCAL W e, cW rR, 
b+r H,a*H), 
10. 其 余 情 况 一 0. 
与 上 上 例 一 样 ， 按 上 述 硕 序 规定 优先 级 。 在 图 20-2 举 了 一 个 例子 ， 
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用 以 说 明 规则 的 使 用 方式 ， 现在 记 这 个 元 胞 自动 机 为 了 PF， 则 可 以 
PERH 
LACF)) -81U 8s, 
SQ-(R--0) r0) (W +0 G4-0)*L-4-05*, 
S5-- (CR 4-0)* (7 +0) LOOWOO rO RCUA- 0)* CL 1-05* |$270)., 
然后 证 骨 .CACF)) 是 上 下 文 有 关 语 言 , 但 不 是 上 下 文 无 关 语 言 。 
具体 证 明 过 程 这 里 从 赂 . 


T L iW Tor W l r A 
" ri i Ww rr We fo f 
i Ww L!WrRE r 
i WoL l Ww 7 E 
图 20-2 


$20.4 关于 复杂 性 的 一 些 理论 结果 


在 研究 4(Z) 的 复杂 性 时 ， 已 经 知道 有 一 个 普遍 性 的 限制 

设 了 了 为 元 胞 自动 机 ， 太 为 符号 集 ， 可 以 证 明 ， 极 限 集 语言 
(ACP)) 在 如 中 的 补 ( 即 8" 一 (A(F))) 一 定 基 递归 可 救 举 语 
言 ， 即 在 乔 姆 斯 基层 次 体系 中 最 高 一 层 的 语言 ( 见 $ 2.4、$ 2.5 和 
$ 3.1)， 这 即 是 图 灵机 能 够 识别 和 枚 举 的 语言 

这 个 结论 的 意义 在 于 ， 如 果 将 大 量 存在 的 非 递归 可 放 举 语言 
看 成 是 复杂 程度 不 可 计算 的 情况 ， 那 么 对 元 胞 自动 机 来 说 ， 至 少 
S*~.Z(ACF)) 的 复杂 窒 度 仍 属于 可 计算 的 范围 中 . 

证 明 是 容易 的 ， 设 有 

zC S*— LACF)), 
那么 从 定义 有 
FARY) =) ZUG), 


因此 , 至 少 存 在 一 个 自然 数 ,使 
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zd S FI CS2)). 

现 设 元 胞 自动 机 的 邻 域 半 径 为 7 我 们 可 以 说 明 , 对 任何 自然 
Km>0, —*+ REA mR BEA S ee ZE) 
这 是 一 个 只 需要 有 限 步 计 算 即 可 解决 的 问题 ， 实际 上 , 利用 五 与 
c 可 交换 , 考虑 所 有 长 度 为 mw 十 23n7 HASH, 它们 共有 Em, 
BTRE CITE 8" 映射 下 的 象 是 否 等 于 ”就 可 以 解决 上 上述 问 
题 . 

现在 可 以 设计 一 个 图 灵机 来 做 上 述 工作 ， 从 j=1 开始 做 起 ， 
ERR CESEN, Wet MARAT, BK Beg 
FFS )) 为 证， 这 时 图 灵机 接受 “调停 村. 这 样 的 图 灵机 即 是 
接受 语言 5 一 也 (A( 了 F)) 的 自动 机 ， 因 此 这 是 一 个 递归 可 枚 举 语 


= 


B. 

但 对 于 2E -CAC(F))， 则 上 述 图 灵机 将 无 休止 地 计算 下 去 ， 
因此 上 述 命 题 并 没有 对 语言 ZL4( 五 )) 带 来 什么 限制 ,实际 上 , 在 
[104] 中 已 经 用 抽象 的 方法 证 明 , 存在 一 个 元 胞 自动 机 卫 ， 它 的 极 
有 限 集 语言 ZA) 不 是 递归 可 枚 举 语 言 . 与 本 书 $12.4 mg, 
我 们 看 到 在 单 峰 映射 和 在 元 胞 自动 机 中 ， 都 存在 不 可 计算 的 复杂 
性 ， 当然， 不 可 能 给 出 这 方面 的 具体 例子 ， 因 为 这 直接 违反 了 在 
8 2.4 rp BY psp PL GE ek, 

此 外 , 在 元 胞 自动 机 中 存在 着 大 量 的 不 可 判定 问题 , 其 中 包括 
在 $ 18.2 sp (SERE DR] RR PURGE ETE RS e CA CP) Ae FRE, 
FEI. Kari) 已 经 证 明 , 关于 元 胞 自动 机 的 任何 一 个 非 平凡 命题 
都 是 不 可 判定 的 (参见 [99]、[98]). 这 里 的 不 可 判定 问题 的 含义 
是 , 不 存在 一 个 有 效 算法 , 它 可 以 对 一 切 元 胞 家 动机 在 这 个 问题 上 
作出 “是 ”或 “ 否 ” 的 回答 ”当然 ， 这 完全 不 排除 可 以 对 一 个 或 一 类 
元 胞 自动 机 在 相同 问题 上 作 击 彻底 的 分 析 . 

XT on(F)(- Per ol) CAE, 任何 ACE) ) 一定 是 递 
In A 3. Be [104] t AMAT, CA I CCP) 
ASE MA S GB $2.55 [1]. 
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$21 p SH RR 


SOTA ET [a AR BO So S LIGERA, CELERE [98] p re ar 
的 


$21.1 两 种 不 同 的 炳 

在 [53] 中 对 语言 LPG) 计算 了 它 的 篇 .这 里 精 的 定义 
AGA § 138.1 完全 相同 ， 其 中 的 计算 方法 则 是 在 8$13.4 中 的 伴 
Uu E 

在 $18.6 已 经 指出 ,对 语言 (KS) EX RYA EJUS SG Dc) 

WW, 它 反 映 了 动力 系统 的 轨道 的 多 样 和 性 ， 在 这 个 意义 上 , 我 
们 说 在 $13.1 中 定义 的 炉 具 有 动力 学 意义 . 
”但 在 [53] 中 所 计算 的 语言 SPS) ) MSR, E 
吴 了 在 国定 时 刻 1= 时 映 象 FiCS5) 中 空间 构 形 的 多 样 性 , 并 不 具 
有 时间 方向 上 的 动力 学 意义 ， 因 此 在 [53j 中 称 这 样 前 炳 为 空间 舌 
是 合适 的 . 

从 包含 关系 

S?'2F(SD)D#*(8*) a+ 
可 以 看 出 BUE 6 的 增加 , 语言 SPS”) ) B8 APEX TC RD PATE, 
可 以 认为 ， 这 反映 了 元 胞 家 动机 随 着 时 间 演 化 有 可 能 表现 出 一 定 
的 自 组 织 能 力 . 因此 研究 这 样 的 序列 也 许可 获得 一 定 的 信息 ， 但 
是 这 里 与 APD, EA P 为 满 射 等 情况 时 就 不 可 能 
得 到 什么 . 

在 !59] 中 已 经 提出 了 时 间 精 的 概念 ， 指 出 要 与 上 述 空 间 箭 
TAS. RRR LEIS] A —~ ORT A CED EPI) 给 出 了 计 
算 公 式 ， 研 究 了 它 的 正本 性 质 ， 这 就 是 本 节 要 介绍 的 主要 办 
$$. 
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821.2 元 胞 自动 机 的 拓 站 粹 计算 


将 元 胞 自动 机 了 作为 动力 系统 来 研究 ， 即 将 映射 有 :有 一 > 
迭代 而 成 动力 系统 时 , 则 在 [53] 中 提出 的 时 间 科 即 是 该 动力 系统 
的 拓扑 业 ， 在 [98] 中 给 坊 了 拓扑 篇 的 计算 公式 : 

ics Ee en) 
其 中 Rw, OETA? 在 空间 宽度 为 ww， 时 间 高 度 为 的 
矩形 上 所 有 可 能 图 式 的 个 数 . 

根据 在 $13.6 RAIMA, BOB ERR AA 
正确 性 及 其 含义 , 

设 符号 集 S 中 符号 个 数 为 k. 利用 元 胞 自动 机 的 平移 不 变性 ， 
即 如 与 可 交换 性 ， 只 机 考虑 元 胞 位 置 了 满足 Occ 的 一 段 ， 
这 时 可 能 出 现 的 多 部 (长 为 ww 的 ) 符 号 串 共 有 闻 个 将 ”中 所 有 
构 形 按照 在 这 包 个 元 胞 位 置 上 的 状态 来 分 类 ， 即 将 在 这 段 上 相同 
的 构 形 作为 一 个 类 , 就 可 以 将 S7 划分 成 Br 个 子 集 合 ， 按 照 在 57 
中 引入 的 距离 拓扑, 它们 都 是 开 集 , m woo 时 每 一 个 开 集 的 直 
径 趋 于 0， 按 照 $ 13.6， 只 要 对 这 个 划分 (序列 ) 来 计算 拓扑 痪 就 
可 以 了 . 

如 记 上 述 划 分 为 w, 则 按 $ 18.6 中 的 公式 , 就 有 


MF) - Vus KE, -iaht z (ri). 
考虑 划分 V F^) Mg A TAA. 如 果 。 属于 这 个 加 细 划 
分 中 的 某 个 于 集 那么 oF (0), +, Fe) H 0 dto 3E— Bt 


的 符号 串 都 是 确定 的 . 因此 ,这 个 加 细 划 分 的 子 集 个 数 就 是 上 面 
给 出 的 FR, t), BIUR 


w(V F-()) = RGs, t). 
因此 就 得 到 — H(VF G))-1 Rw, 0, 
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计算 公式 已 经 证 明成 立 . 
从 这 个 公式 容易 给 出 及 也) 的 上 界 估计 . 
BF 的 邻 域 半径 为 r, RWA R, t) 不 会 超过 在 t=0 时 刻 的 
长 度 为 ww 十 2r(t 一 i) 的 元 胞 状态 的 可 能 符号 串 个 数 : 
Hw, HKPD 
代入 公式 中 , 就 得 到 拓扑 煽 的 上 界 : 
h(F)«2rlog k, 


$21.89 举例 


[1] 38-10, 1, ---, k-1}, 那么 移 位 算 子 o 本 身 也 是 
一 个 元 胞 自动 机 ， 对 于 加 =2 和 ”w=1l1， 这 就 是 170 号 初等 元 胞 自 
动机 .这 时 易 见 有 

Au, Pega 
RAAR, 得 至 好 的 拓扑 篇 为 
h(a) = log k, 

这 是 遍历 理论 中 的 一 个 典型 例子 (参见 [871). 

[4] 2] 在 上 一 小 节 中 给 出 的 拓扑 炉 的 上 界 是 可 以 达到 的 . 仍 
1x 8-10, 1, --, 一 位 ， 定 义 局 部 映射 为 具有 可 加 性质 的 

Flairs eee, diy tt Bigr) = È an mod $, 
可 以 证 明 这 时 的 
R(w, g) = Berend), 

即 已 达到 最 大 可 能 的 多 样 性 , Moni RA _b Fr log h, 

现在 证 明 关 于 Rew, Hw LRA. 

用 反 证 法 .如 果 些 公式 不 成 立 ， 则 表明 在 1=0 时 刻 有 两 个 长 
为 2 十 25 导 一 二) 的 不 同 符号 串 , EME we xo 的 矩形 中 生成 完全 相 
局 的 图 式 ， 册 于 上 述 元 胞 自动 机 具有 可 加 性 ， 在 相 减 后 就 得 到 在 
ti 一 0 对 刻 的 一 个 不 全 为 0 TERES B, CE X r 矩形 中 生成 完全 为 
0 的 图 式 ， 在 图 21-1 中 作出 了 示意 图 ， 从 粹 的 计算 公式 可 以 看 
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aS 


[a 


ii, woo RRR, BRAGA Rw> er, ME 21-1 可 以 看 
出 ,在 t=0 HAREA w-e2e0—1) 090] B op, fero i Eon 
ug 的 子 串 已 全 由 符号 omm, BUE 
x 人 矩形 中 的 一 部 分 。 由 此 出 发 , 利用 wo 
2r, BD ay HE BH t—O py ži jn) d Jy wt 2r(t 
一 1) 的 符号 串 完 全 由 符号 0 组 成 、 这 与 上 
述 假定 相 矛 盾 . 

I 例 3] 例 2 在 初等 元 胞 自动 机 中 的 特例 即 是 基 0 号 ， 

ili->1, 110->0, 10i—0, 1001, 
0110, 0101, 001—>1, 000-50, 
从 819.5 的 讨论 可 见 ， 这 时 的 元 胞 自动 机 召 也 是 从 & 到 自身 上 
的 满 射 ， 即 有 
F(S*)-S*, ACF)— 87. 

从 计算 机 实验 ( 见 [93] 的 表 2) 可 知 150 号 元 胞 自动 机 的 动力 学 行 
为 明显 属于 第 三 类 ， 即 混沌 行为 ， 从 极限 集 AF) 不 能 反映 出 这 
一 点 ; 但 拓扑 炉 达 到 极 大 则 正确 地 反 瞻 了 动力 系统 的 混沌 特性 ,可 
以 将 这 种 情况 与 单 峰 喘 射 中 的 满 射 情况 相 比 拟 ， 

[H4] 对 于 0 号 元 胞 自动 机 可 以 作 类 似 的 讨论 。 容易 证 
BH, 这 时 前 篇 也 达到 了 极 大 信 247=1, 一 2), 在 $19,5 我 们 已 经 
知道 , 用 极限 集 方法 来 讨论 90 号 元 胞 自动 机 是 不 成 功 的 ,因此 , 可 
LUA £ [98] FR d BR TRAE VERA A, MLS PETERS f BEXT 
T 90 51150 号 元 胞 自动 机 的 动力 学 行为 给 出 了 一 个 令 人 满意 
的 刻 划 . 

[fib] 对 于 204 号 元 胸骨 动机 , 局 部 映射 规则 为 

iii-»1, 110—1, 101—0, 100-0, 
01i—1, 010-1, 001—0, 000-50, 
实际 上 , 这 个 元 胞 自动 机 是 在 S7 上 的 恒 等 映 射 . 当然 ， 它 也 是 满 
射 , #087) =S87 MAPS? sr. AAA SES, 
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E 21-1 


与 直面 的 150 Ef 90 号 元 胞 眼 动机 可 无 区 别 ， 得 到 的 值 都 是 鞋 
它 反映 了 符号 出 的 多 样 性 已 达到 最 大， 但 这 丝毫 不 反映 204 号 在 
动力 学 行为 上 的 简单 性 . 

用 拓扑 入 计算 公式 , 容易 求 出 这 时 的 

Riw, 1) - 2", 

代入 公式 即 得 到 A(CP)—0, TEUER T 204 号 在 动力 学 行为 
方面 的 特征 . 

除去 以 上 例子 外 , BARBIE, fk 8 18.2 研究 过 的 幕 零 型 元 
He E oh Lao ah Sh EE 0. 

HG WY EL FA Th aT TTI ES 19 研究 过 的 76 号 、128 号 、18 
225 5588 ELS EL, WHA TH 0, 而 后 两 个 的 折 
TMA MBER TF ORY. 


§21.4 理论 上 的 限制 

WEBE, HFR AT LA YA Se PY SH E SAL 
的 研究 中 .但 目前 缺少 关于 Rew, t) 的 计算 方法 ， 因 此 就 限制 了 
拓扑 炉 的 应 用 ， 在 这 方面 了 解 一 下 理论 上 的 限制 是 有 必要 的 . 

在 198j 中 利用 计算 理论 得 到 了 下 面 列 出 的 三 个 否定 性 结论 : 

1. 不 存在 一 种 算法 , 它 可 以 对 每 一 个 元 胞 自动 机 判定 其 拓扑 
MBA 0, 

2. 对 于 任意 给 定 的 正 数 s, 不 存在 一 种 算法 , 它 可 以 对 每 一 个 
元 胞 自动 机 判定 其 拓扑 炉 是 否 大 于 5. 

9. 对 于 任意 给 证 的 正教 s 不 存在 一 种 算法 ， 它 可 以 对 每 -~ 
个 元 胞 自动 机 计算 其 拓扑 烂 的 近似 值 , 使 误差 不 超 过 8, 

当然 , 这 丝毫 不 能 说 明 对 很 多 元 胞 自动 机 来 说 , 我 们 不 能 求 出 
EMA. SPAR ER, JOM KE RA Ft 
究 元 胞 自动 机 的 重要 工具 ， 它 们 只 是 告诉 我 们 ， 要 设计 出 对 一 切 
元 胞 自动 机 都 适用 的 拓扑 录 算 法 是 不 可 能 的 , 
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Per(F) -a(F) — (dg ACF) 
成 立 的 例子 ， 这 在 8 18.4 中 已 经 提 到 ， 在 [98] 中 还 指出 , 这 类 全 
子 中 的 拓扑 焙 可 以 具有 任意 大 的 数值 ， 这 表明 相应 的 动力 学 行为 
是 很 复杂 的 . 
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第 7 章 


单个 序列 的 复杂 性 


本 章 研 究 对 象 为 单个 序列 的 复杂 性 分 析 ， 这 与 本 书 前 面 各 章 
都 不 相同 ， 也 可 以 用 本 章 的 方法 来 研究 动力 系统 , 这 时 , 不 同 的 轨 
道 可 以 有 不 同 的 复杂 性 . 

已 经 清楚 ， 关 于 单个 序列 的 复杂 性 概念 与 随机 性 概念 是 不 能 
分 开 的 ， 这 里 要 指出 , 后 者 与 概率 论 中 的 随机 概念 是 不 一 样 的 . 问 
题 的 特点 是 只 研究 给 定 的 一 个 序列 , 不 问 其 来 源 如 何 . 

本 章 的 前 两 节 介绍 柯 尔 莫 哥 洛 夫 (A. H. Korxoropos) 2 RHE, 
它 在 单个 序列 的 复杂 性 研究 中 具有 根本 的 意义 ， 但 在 具体 应 用 中 
则 不 如 后 两 节 的 两 种 刻 划 方法 来 得 方便 . 

如 何 分 析 一 个 给 定 序列 的 复杂 性 是 一 个 有 实际 意义 的 重要 问 
题 . 本 章 只 是 一 个 很 肤浅 的 介绍 ， 其 中 有 不 少 内 容 本 身 也 不 很 成 
Hh, 尚 处 于 发 展 之 中 , 希望 对 候 者 能 起 到 一 点 抛砖引玉 的 作用 . 


$22 ” 柯 尔 英 可 党 夫 复杂 性 


这 一 节 主 要 介绍 在 单个 序列 的 复杂 性 刻 划 中 的 困难 所 在 ， 提 
出 柯 尔 划 哥 洛 夫 复 杂 性 的 定义 .主要 材料 取 自 [105]. 


$22.1 单个 符号 序列 的 复杂 性 

符号 序列 出 现在 极为 众多 的 各 个 科学 技术 领域 中 , 例如 通信 、 
密码 、 遗 传 工程 等 等 ， 经 常 出 现 的 问题 是 对 于 一 个 给 定 的 符号 序 
列 ， 如 何 分 析 它 的 复杂 性 ， 从 直观 上 可 以 知道 ， 某 些 序列 是 简单 
fa, 例如 
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0000000000000000, 1010101010101010, 
当然 一 点 不 复杂 ， 另 一 方面 , 对 于 

0010101110111010, 0110001001111011, 
就 不 容易 说 它们 是 否 复 杂 了 .在 平时 我 们 也 往往 使 用 随机 性 这 个 
词 来 代替 复杂 性 ， 例 如 , 说 前 丙 个 序列 不 是 随机 的 , 而 后 两 个 序列 
则 似乎 是 随机 的 . 

从 一 开始 就 应 当 指 出 ， 上 述说 法 与 概率 统计 理论 中 的 随机 概 
念 是 完全 不 一 样 的 , 后 者 是 有 严格 定义 的 数学 概念 . 因此 , 像 上 面 
那样 用 随机 性 代替 复杂 性 的 说 法 并 没有 给 我 们 带 来 任何 东西 . 

下 面 主 要 讨论 有 限 长 度 的 符号 序列 ， 与 本 节 其 余部 分 一 tE, 
用 8 表示 一 个 有 限 符号 集 , 用 8* ERRE 8 的 有 限 序列 爹 体 .与 
本 书 其 余部 分 不 同 的 是 , 我 们 在 这 里 研究 S 中 一 个 给 证 序列 的 复 
Ay TE ZIRI Pal 

对 于 这 样 的 问题 , 乔 姆 斯 基 的 层次 体系 不 能 提供 什么 结果 . 事 
Sb, 对 于 只 含 一 个 符号 串 的 语言 LD={z} 三 S"， 只 能 说 它 是 正规 
语言 (或 者 有 限 语 言 )， 容 易 知道 ， 接 受 工 的 最 小 有 限 自 动机 具有 
平凡 的 结构 , 它 的 状态 个 数 凡 与 2 的 长 度 有 关 , 而 与 本 身 是 否 具 
有 某 种 复杂 性 无 关 .， 因 此 在 这 里 需要 建立 完全 不 同 的 理论 . 

首先 指出 , 不 可 能 有 任何 一 个 合理 的 方法 , 它 能 将 符号 串 全 体 
简单 地 划分 成 复杂 和 简单 的 两 类 ， 用 反 证 法 .如 果 存 在 这 样 的 方 
法 ,那么 在 本 节 一 开始 举 出 的 两 个 序列 当然 属于 简单 序列 ， 我 们 
不 知道 后 面 两 个 序列 按照 这 个 方法 是 划分 在 简单 类 还 是 复杂 类 
rp, 但 总 应 该 存在 某 一 个 序列 , 它 在 这 种 划分 方法 下 是 复杂 序列 . 
此 外 , 在 一 个 复杂 序列 中 任意 改变 某 一 个 符号, 不 应 当 使 这 个 复杂 
序列 一 下 子 就 变 成 为 简单 序列 , 这 也 是 一 个 合 班 的 要 求 ， 

由 此 出 发 即 可 引出 矛盾 .实际 上 , 任 取 一 个 复杂 序列 , 从 第 二 
个 符号 开始 ,如 果 它 与 前 一 个 符号 不 同 ， 就 将 它 改变 成 与 它 一 样 
否则 就 看 下 一 个 符号 ， 这样 的 每 一 步 动作 都 保持 了 所 得 到 的 序列 
为 复杂 序列 的 特点 ， 由 于 序列 长 度 有 了 眼 ， 因 此 有 了 眼 步 后 就 得 到 完 
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全 由 同一 个 符号 给 成 的 简单 序列 .这 显然 是 个 矛 技 . 

以 上 启发 性 的 讨论 告诉 我 们 ， 关 于 符号 序列 的 复杂 性 刻 划 不 
可 能 是 非常 简单 的 ， 实 际 上 ， 只 是 在 60 AX, 利用 了 计算 理论 中 
的 大 量 成 果 之 后 才 形 成 了 下 面 要 介绍 前 定义 .。 


822.2 关于 随机 性 的 讨论 


这 里 简要 地 说 明 一 下 ， 关 于 单个 符号 序列 的 复杂 性 或 随机 性 
的 刻 划 问题 与 概率 沦 中 的 随机 性 概念 没有 直接 关系 . 

在 概率 论 中 生成 随机 序列 的 最 容易 的 例子 就 是 挪 硬币 试验 . 
将 一 枚 有 正 反 面 区 别 的 均匀 硬币 掷 宛 次 ， 在 落地 时 将 正面 朝 上 记 
为 了 反面 闽 上 记 为 0, RA UBT RED ONT SA. 从 经 
验 就 可 以 知道 ,在 n% 充 分 大 时 , 出 现 符 号 1 的 次 数 与 出 现 符 号 0 的 
次 数 一 般 是 比较 接近 的 ， 但 这 里 绝对 没有 排除 连续 多 次 出 现 正 面 
朝 上 或 相反 的 可 能 性 . 从 理论 上 这 是 独立 随机 变量 序列 ， 它 是 最 
简单 的 一 种 随机 过 程 ， 有 完整 的 数学 理论 ， 但 每 次 试验 得 到 的 符 
号 序列 只 是 这 个 随机 过 程 的 一 个 样本 ， 在 概率 论 中 并 没有 对 一 个 
样本 是 否 随 机 下 崖 义 ， 就 上 述 试验 来 说 ， 由 % 次 撕 硬 币 可 得 到 2 
个 不 同 的 符号 序列 ， 根据 概率 论 ， 它 们 中 的 每 一 个 出 现 的 概率 都 
是 27. KARN, 在 本 节 开 始 所 举 的 四 个 符号 序列 ， 如 果 作 为 撞 
硬币 试验 得 到 的 结果 来 看 待 , 则 出 现 的 可 能 性 完全 一 样 . 

这 表明 在 研究 一 个 给 定 序 列 的 复杂 性 刻 划 问题 时 ， 我 们 不 应 
当 与 该 序列 的 生成 过 程 发 生 联 系 .。 在 数学 上 为 随机 的 信 源 所 生成 
的 符号 序列 ,在 直观 意义 上 未 必 是 随机 的 . 

相反 的 情况 大 量 存在 . 在 计算 中 广泛 使 用 的 擅 随 机 数 发 生 器 
即 是 一 个 例子 ， 它 生成 的 序列 完全 是 确定 性 的 ， 但 却 可 以 通过 各 
种 关于 随机 性 的 检验 要 求 ， 另 一 个 例子 是 取 适 当 参 数值 的 二 次 方 
映射 或 帐 确 映射， 后 者 可 以 直接 用 作 随 机 数 发 生 器 ， 动力 系统 的 
一 个 重要 发 现 束 是 ， 一 个 完全 是 确定 性 的 简单 系统 可 以 产生 看 起 
来 完 侈 为 随机 的 输出 (参看 [22] 等 文献 )。 

133 


$22.8 ”描述 复杂 性 


对 于 一 个 给 定 的 符号 序列 , 如 何 定义 其 复杂 性 或 随机 性 , 这 在 
历史 上 并 不 是 新 闻 题 , 但 在 60 年 代 之 前 始终 没有 令 人 满意 的 方法 
能 解决 这 个 问题 . 

在 60 年 代 中 差不多 同时 , 有 三 个 人 分 别 独 立地 提出 了 相同 的 
HE. BERKATE, KT (G.J.Ohaitin) MRAR 
K(R. J. Solomonoff), 这 种 复杂 性 的 定义 在 且 前 有 许多 不 同 的 
名 称 , 与 文献 [105] 相 一 致 我 们 称 它 为 柯 尔 莫 哥 洛 夫 复杂 性 ， 这 方 
面 的 原始 文献 是 [106] ~ [108], [105] 是 一 个 详细 的 综述 ， 包 括 问 
题 的 历史 和 理论 的 多 方面 应 用 , 并 附 有 详细 的 文献 ， 

先 从 一 些 简 单 情况 说 起 ， 设 想 机 将 一 个 符号 串 作 为 信息 传送 
出 去 ， 考 忠 是 否 有 比较 经 济 的 传送 方法 “” 如果 要 传送 的 是 长 为 办 
的 全 0 串 ， 则 可 以 将 “打印 m 次 符号 0” 这 名 话 发 送出 去 . 这 里 除 
了 :oo 这 个 信息 之 外 ， 其 他 字 都 可 以 按 某 种 固定 方式 编 成 符号 趾 ， 
其 长 度 与 m 无 关 ， 如 果 符 号 集 为 &B= {0, 1}, 则 大 致 用 log% 位 二 
进 制 数 就 可 以 将 % 转 化 成 S* 中 的 符号 种 ， 例 如， 从 22° = 1024 ay 
AL, 用 不 到 十 个 的 0.1 符号 就 可 以 将 一 千 以 下 的 表示 出 来 , 

于 是 用 logn-re 位 长 度 的 0.1 符 号 串 就 可 以 将 长 度 为 n% 的 全 
0 申 这 个 信息 传送 出 去 ， 其 中 。 是 与 nn 无 关 的 常数 ， 当 %% 充 分 大 
Ej, 这 个 方法 与 直接 将 这 个 符号 串 原 封 不 动 传送 出 去 的 方法 相 比 ， 
当然 要 好 得 多 ， 对 于 在 本 节 一 开始 给 出 的 第 二 个 例子 , 即 10 串 的 
多 次 重复 , 也 可 以 采用 类 似 的 方法 处 理 . 

如 果 要 传送 的 符号 串 看 上 去 杂乱 无 章 , 找 不 出 什么 规律 , 则 只 
能 采取 原原本本 将 它 发 送出 去 的 方法 . 

由 此 可 见 ， 问 题 在 于 对 一 个 给 定 的 符号 串 有 没有 某 种 比较 简 
单 的 描述 方法 ， 如 果 可 以 用 比 原来 的 符号 串 短 得 多 的 方法 来 描述 
它 , 那么 只 要 将 这 个 描述 本 身 ( 转 化 为 符号 串 ) 发 送出 去 就 可 以 了 ， 

反之 , 如 果 对 于 一 个 符号 串 的 描述 只 能 是 其 自身 , 则 除了 将 它 原 原 
18? 


本 本 发 送出 去 之 处 就 没有 更 好 的 方法 了 . 
FET BALE, PAVE DE Sh ARHI BO AR H RYE R Te: 
一 种 描述 复杂 性 .实际 上 , 这 也 是 它 在 文献 中 使 用 的 名 称 之 一 . 


§22.4 柯 尔 英 哥 治 夫 复 杂 性 的 定义 


利用 计算 机 可 以 将 上 面谈 论 的 描述 具体 化 为 一 个 程序 ， 将 它 
输入 到 计算 机 中 就 能 产生 出 给 定 的 符号 序列 . 为 简单 想见， 假定 
符号 序列 和 程序 都 只 用 0 和 1 两 个 符号 表示 ， 程 序 本 身 也 是 符号 
Hi. 

设 给 定 的 符号 串 为 o 将 产生 sw 的 程序 记 为 2， 对 一 个 计算 机 
来 说 ,p 是 输入 , e 是 输出 . 关于 一 个 符号 串 @ 的 柯 尔 莫 琳 洛 夫 复 
杂 性 就 是 产生 w 的 最 短程 序 jp 的 长 度 ， 它 反 瞎 了 对 符号 囊 v 的 最 
经 济 的 描述 所 需要 前 符号 个 数 ， 可 以 记 有 关 的 计算 机 为 T, 而 将 
上 述 定义 写 为 

rn(w) 二 min{ |p| |p 为 产生 z REY. 
如 这 样 的 了 不 存在 , WS 六 ztw) 一 co， 但 这 个 定义 与 计算 机 有 
X. 容易 理解 ， 刻 划一 个 符号 串 的 复杂 性 的 方法 不 应 当 依赖 于 
所 用 的 计算 机 .， 下 面 将 要 证 明 ， 存 在 一 种 具有 某 种 “客观 性 ”的 计 
算 机 , 可 以 克服 上 述 定义 的 缺点 . 

这 里 需要 在 83.4 中 介绍 的 图 灵机 和 通用 图 灵机 的 概念 . 我 
们 知道 ， 可 以 将 图 灵机 全 体 按 照 基 种 方式 编号 成 符号 序列 ， 记 
UT) BERIT HHS, CASE RA—PbHO, 1 组 成 的 符号 
串 ， 将 上 夯 的 定义 中 的 计算 机 都 看 成 为 某 个 图 灵机 , RRA 
灵 论 题 这 都 没有 问题 , 

现在 设 U 是 一 个 通用 图 灵机 ， 它 可 以 模拟 任何 一 个 图 灵机 的 
动作 ， 并 相应 地 定义 五 o(c)， 它 是 在 通用 图 灵机 上 生成 各 之 并 停 
机 的 最 得 输入 的 符号 串 长 度 . 

我 们 考察 Kræ) Kro AHE, HPT RETR 
pi. 
199 


pA ARAL T EERE ”的 最 短程 序 , BUE 
|p| 7 Kz(2). 
现在 设 了 的 编号 为 %(T)， 我 们 可 以 将 符 导 串 ip 输入 到 上 述 
通用 图 灵机 UV 中, 要求 避 在 接受 0" 汪 之 后 的 动作 完全 模拟 外 的 
动作 ， 这 样 一 来 ， 由 于 并 在 输入 p 时 能 生成 符号 串 并 停机 ， 因 
IU FEMA OM 时 也 能 生成 符号 串 oH POL. HREM, 就 有 
Ky(z)«n(T) +14 |p| »n(70--14- Kr(a). 
id UT) +1=0, 它 是 只 与 图 灵机 了 有 有 关 的 一 个 常数 ， 这 样 就 得 到 
Kola) Kz(2)-rc. 

这 表明 , AAS RIO 得 到 的 关于 串 o 的 复杂 性 Ko. 与 用 
其 他 图 灵机 对 得 到 的 复杂 性 Ke (OHM 差别 不 超过 只 与 卫 有 
关 的 一 个 常数 ， 在 这 个 意义 上 , 我 们 说 Kole) RR T TEE S s 
身 的 内 在 性 质 , 即 是 对 2 的 复杂 性 的 一 个 客观 度量 . 

还 要 考虑 选择 不 同 的 通用 图 灵机 所 带 来 的 差别 ， 容 易 与 上 面 
— FEW, MRO 是 另 一 个 通用 图 灵机 ， 由 存在 一 个 只 与 站 和 
U' 有 关 的 常数 eyo 使 不 等 式 

LK ulw) ~ Kye) | Sego 

对 任何 符号 串 o 成 立 . 

由 此 可 见 ， 我 们 可 以 在 今后 取 定 一 个 通用 图 灵机 芝 ， 并 将 
Ky(o) 简 记 为 Ko), 我 们 称 这 样 的 五 (@) 是 符号 串 x 的 柯 尔 莫 
哥 洛 夫 复 杂 性 , 


$98 Koo 的 性 质 与 应 用 


在 这 一 节 中 介绍 柯 尔 莫 哥 洛 夫 复 杂 性 Ke) 的 一 些 性 质 和 有 有 
关 应 用 ， 关 于 这 方面 的 全 面 论述 可 参看 [105]. 
§23.1 K@HAALA 
HTU EMAAR 我 们 容易 看 出 E (2) 一 定 是 有 限 数 , 实 
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际 上 可 以 得 到 更 好 的 结果 . 设 卫 是 将 输入 串 查 接 按 原样 输 青 并 
停机 药 一 个 特殊 的 图 灵机 TnL) T KRG. E OTT 输入 
到 通用 图 灵机 U 中 , 就 得 到 不 等 式 

K (2) & |o] e, 
其 中 的 常数 0 一 nT) 十 1, GR we GK. | 

其 次 , 考虑 长 度 [e| =r BOB Ae 2" 个 不 同 的 0. lfi5m. d 

人 
1--2--2?--... 42" 1— 2"— 1, 
HET JIL, Æ r AREA z| p, 至 少 有 一 个 串 的 复杂 性 不 小 
T ial, A 
K (=)> |æ] 
成 立 . 在 这 个 意义 上 , 我 们 说 这 个 串 s 是 不 可 压缩 的 , 也 就 是 不 存 
在 更 短 的 描述 . 

完全 同样 地 可 以 证 明 , EEJ nH A HAAS BH, Ab 
有 二 分 之 一 的 串 的 复杂 人 性 不 低 于 % 一 二 至少 有 四 分 之 三 的 只 的 复 
办 性 不 低 于 % 一 2, …。 现 设 nw 充分 大 , 可 以 计算 出 在 长 朗 为 元 的 
Ep ARF anio 的 串 的 个 数 不 超 过 

2n739—1—1-r-24-2?-- QO 
将 这 个 数 与 总 数 2 相 比 ,可见 在 相同 长 度 的 符号 串 中 ， 有 99.975 
以 上 前 符号 串 的 最 短 描述 只 能 压缩 木 到 10 个 符号 ， Hn RAK 
时 , 这 个 压缩 量 是 微不足道 的 . 
定义 单个 序列 的 函 机 性 的 一 种 方法 是 , 当 1m] =m, BOXE 
K (2) =n— O(log n) 
Bj, 称 串 ALR. 

我 们 在 下 面 将 会 看 到 , 这 售 定 义 并 非 可 以 用 于 真正 的 计算 ,人 世 
TEARI, xe E BENS n HATE mp, An HAKAN, 99.9% 以 上 
的 串 都 是 随机 的 ， 这 与 我 们 的 直观 概念 完全 一 致 、 例 如 在 $3 22.2 
的 郑重 币 试验 中 , 只 要 m 充分 大 , 所 得 到 的 符号 串 在 直观 土 总 是 杂 
GLACE APLAR. 
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在 [1091 中 发 展 了 关于 无 限 符号 串 的 随机 性 定义 , 本 书 不 作 介 
更 一 般 地 , 可 以 定义 g- 不 可 压缩 性 , 或 者 g- 随 机 性 ， 设 g(n) 
是 一 个 整数 值 函数 . HREM TYAS a gHAS A a, Hi AR 
等 式 

到 (ay 
与 上 面 完全 一 样 可 以 证 明 , 在 长 度 为 的 符 导 串 中 间 , 复杂 性 低 于 
n— 9 (的 虽 所 占 的 比例 不 超过 全 9 Rg 具有 性 质 
lim g(n) 一 co) 


则 这 个 比例 趋 于 0. 

已 经 证 明 , 当 m 充 分 大 时 , 不 可 能 证 明 任何 一 个 符号 串 的 柯 尔 
莫 哥 洛 夫 复杂 性 大 于 nm。 在 [105], [110]. [11] 中 指出 ， 3X73J& 
AERA SEALE SEE (Godel Incompleteness Theorem) 在 信息 
论 中 的 表现 形式 . 这 里 涉及 到 形式 系统 等 方面 的 深刻 内 容 ， 本 书 
不 再 介绍 .， 这 里 只 用 于 说 明 ， 要 证 明基 些 符号 串 是 非 随机 是 可 能 
dy. 例如 ， 在 上 节 一 开始 所 说 的 两 个 序列 当 史 充分 大 时 可 以 有 很 
经 济 的 描述 方法 ， 又 如 me 等 常数 的 近似 信 ， 当 位 数 充分 长 时 也 
是 可 以 大 大 压缩 的 , 因为 可 以 用 一 个 相对 很 短 的 程序 来 生成 它们 。 
但 另 一 方面 ， 要 证 明 关 于 一 个 给 定 的 符号 序列 的 任何 找 述 都 几乎 
与 序列 具有 相同 长 度 , 则 是 完全 不 同 的 任务 . 应 用 哥 德 尔 定理 得 
到 的 结果 是 , 已 经 证 明 ,， 当 符号 序列 的 长 度 n% 充 分 大 时 , 这样 的 证 
明 是 不 存在 的 . 注意 这 里 在 同一 名 话 出 现 了 两 个 “证 明 *, 所 指 的 
含义 不 同 . 


§23.2 在 自然 数 集 上 定义 的 K(x) 


设 , ”为 自然 数 , 并 将 o 与 按 字 典 排列 的 符号 串 序 列 
0, 1, 00, 01, 10, 11, 000, 001, --- 
中 的 第 2 个 等 同 起 来 , 然后 将 长) 中 的 自 变 量 按 上 述 方 式 理解 ， 
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这 样 就 得 到 了 在 所 有 委 然 数 上 有 定义 的 整数 伪 衣 数 天 (oa)， 这 一 
ANE St REC 五 (四 ) 的 一 些 基 本 性 质 ， 

HRS Is Era RA = 所 对 应 的 上 述 符 号 串 的 长 度 ( 而 不 是 
的 绝对 值 )、 于 是 可 见 有 |e|~loga, 

这 时 可 建立 函数 下 (ww) 的 下 列 性 质 ; 

1. K(s)«|z|--o, HB e Jg 5s o XXI 

2. |z| — t SI IET RO, E (2) 1 m 的 sz 所 占 的 比例 不 超 
过 2” 

3. lim K (a) oo, 由 于 长 度 有 界 的 描述 ( 即 程序 ) 只 有 有 限 
个 ,因此 它们 所 描述 的 x 也 只 有 有 限 多 个 . 

d. EL mo) Ern K (y), Bl mo) 是 单调 增加 的 整数 函数 ， 
mls) <E (s). TUAH, mo) 是 具有 这 两 个 性 质 的 最 大 函数 ， 
同样 可 以 证 明 lim (2) 一 co. 

5. 下 (w) 不 是 单调 增加 函数 .从 Ka) 的 定义 已 可 看 出 ， 存 
fEm<n, {A K(m)K(nm. Woh, Ho ARES BH, 及 (zw) 对 
少 委 身 的 前 组 也 不 具有 单调 性 ， 例 如 , 对 上 述 一 对 自然 数 mn, > 
s=0", y—0^, Uy XE o RIBUS, HA IK (0) «K(0"), 这 也 就 是 
说 , 部 分 的 复杂 性 可 以 超过 整体 的 复杂 性 . 

6. 五 (z) 是 不 可 计算 函数 , 这 里 需要 在 $2.5 中 介绍 的 概念 ， 
可 以 证 明 , 尺 (%) 不 是 部 分 递 妇 函数 ,因此 在 这 个 意义 上 是 不 可 计 
算 的 ， 不仅 如 此 ， 任 何 定 义 域 为 无 限 集 的 部 分 递归 函数 都 不 可 能 
在 自己 的 定义 域 上 与 Kom 


§ 23.3 KK(w) 在 动力 系统 中 的 应 用 


Het (A. A. Brudno) 将 柯 尔 莫 哥 洛 夫 复 杂 性 用 于 研究 
动力 系统 的 轨道 复杂 性 ( 见 [112], [88D. 这 里 只 限于 对 于 单 峰 
映射 情况 简 述 他 的 研究 . 

设 f: [0, 1]->[0, 1] 是 $ 5 中 介绍 的 单 峰 映 射 。 记 从 5 出 发 

194 


KA 

fl) = (s, fm), ^ fr, 7), 
踪迹 为 

I (a) = A(f'(2)) = (sore swt). 
对 于 从 2 出 发 的 轨 , 定义 它 的 复杂 性 为 


K (a) - lim 二 K (so81-++S,_1), 


其 中 KE (sosy 8,3) E FF AN $0817**8,.1 的 柯 尔 莫 哥 洛 夫 复 2e. 

在 [112] 中 证 明 , WOR po ERF f AE, WART 
HA- 几乎 处 处 mw 成立 

K (2) zh 

这 里 的 hs SRF po Mu HERR. es DL 在 [112] 中 对 于 相当 一 般 
的 动力 系统 证 明了 这 个 结论 . 

如 果 上 满足 施 瓦 效 导 数 为 负 的 条 件 , 则 在 [88] 中 证 明 , 对 于 在 
艇 中 格 测度 意义 下 的 几乎 所 有 m 尺 (w) 是 一 个 常数 ， 将 这 个 常数 
A K, 又 可 以 证 明 , EAE EE KIRK ADO 时 , RIE 

K=n. 
XLT fe a MUR A, 则 已 证 明 有 
K —0, 

WETE, GAY GERE XU PE I HET 307] RENEA 
结果 , 与 李 雅 普 诺 夫 指 数 和 测度 篇 在 很 多 情况 是 一 致 的 . 

在 [88] 中 指出 , K 在 某 些 情况 是 关于 动力 系统 复杂 性 的 一 个 
更 为 深入 的 刻 划 . 已 经 证 明 , 对 于 满足 不 等 式 

O<h< SAAN 
的 每 一 个 存在 满足 施 瓦 疙 导数 为 负 条 件 的 单 峰 映 射 fF, 它 的 李 
雅 普 诸 夫 指 数 和 =0, 但 却 有 K -A Roe, RRS UTR 
族 中 也 是 存在 药 。 
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§23.4 在 形式 语言 中 的 一 个 应 用 

介绍 柯 尔 莫 器 洛 夫 复 尖 性 在 形式 语言 中 的 一 个 应 用 ， 它 在 很 
多 情况 中 可 以 代替 在 35.7 HIP ERIS SES ERR. 

定理 WLES 为 正规 语言 ; 则 有 一 个 只 与 工 有 关 汐 常数 6， 
使 得 对 于 每 一 个 符号 串 z€S*, mm 

yE Loe—{y | ey € L}, 
THB y 在 Le 中 按 字 典 方式 排序 时 是 第 % 个 串 , 那么 成 立 
K (y) «& K (n) -re. 

我 们 给 出 这 个 结果 的 证 明 , 然后 举例 说 明 它 的 应 用 . 

证 明 的 关键 是 考虑 2 的 描述 . 由 于 工 是 正规 诺言 , 设 M 是 接 
受 了 工 前 确定 性 有 限 自 动机 ， 设 在 输入 2 之 后 自动 机 处 于 状态 9. 
Mq 出 发 ， 按 字典 方式 顺 见 检查 合 自 动机 进入 终止 状态 的 第 环 个 
符号 串 当然 就 是 Y， 这 就 提供 了 对 的 一 个 描述 ， 可 以 用 一 个 图 
灵机 来 实现 这 个 描述 , EAE LAB BL, 同时 能 按 字 上 典 方 
式 的 顺序 搜索 y， 在 这 个 措 述 中 ， 信 息 % 蚌 必需 的 ， ERREN 
K@), BA NAG 只 有 有 限 个 ， 就 可 以 求 出 与 无 关 的 当 数 性 ， 
得 到 所 要 的 不 等 式 . 

可 以 看 出 ， 从 本 质 上 来 说 这 个 结果 与 本 书 在 31.8 介 绿 的 迈 
希 尔 - 奈 罗 德 定理 是 一 致 的 , 

MER TAT. KN ARSE. 设 S= {0}, K 

L={0? | p A 38A. 

我 们 证 明 工 不 是 正规 语言 . 

Er 是 第 个 素数 ,jp 是 第 h+L PRR. RNA p-p 的 
最 小 值 为 2， 即 2 和 2 为 挛 生 素数 的 情况. (BAA UE p-p 没 
ALR, Biüpat-2,n!--8, e, ncn EIE ZUG HP n EE 
BARK. HENMAVMATERZERANF an, 

令 a=, HERE 
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Le= {yeyE L}, 
EH y=0 是 第 一 个 串 , 利用 上 面 的 结果 , 以 及 生前 有 %=1， 
就 得 到 
K(p—p)-0(Q), 
右 旋 是 一 个 由 语言 L 确定 的 常数 .由 于 长 度 有 界 的 描述 只 有 右 限 
多 个 , 这 与 p 一 p' AAMAS. 
柯 尔 黄 哥 洛 夫 复杂 性 己 有 多 方面 的 应 用 , 可 参看 [105], 


§24 基于 移 位 寄存 发 的 复杂 性 


本 节 介 绍 以 移 位 寄存 器 为 基础 的 复杂 性 刻 划 方法 ， 材 料 主要 
来 自 LLL3] ~ (1201, | 


$24.1. 移 位 寄存 器 序列 
考虑 符号 序列 


s= grege 
它 可 以 是 有 限 或 无 限 序 列 . 如 果 存 在 自然 数 %， 使 得 在 序列 s 中 
从 第 ?2+1 个 符号 开始 , 每 一 个 符号 都 可 以 由 在 它 之 前 的 m 个 符号 
定 , 即 满足 递归 关系 
8 = f(Siny Sica, 70, $1), iM, 

WAs 为 (反馈 ) 移 位 寄存 器 序列 。 它 可 以 用 图 24-1 中 的 (反馈) 
移 位 寄存 器 来 实现 , HPA ne SER, 我 们 按 从 右 到 左 的 顺序 称 
它们 为 第 1 级 .第 2 级 …、 Br RBS. 每 一 级 寄存 器 都 可 以 
处 于 有 限 多 个 状态 中 的 任何 状态 。 这 对 应 于 符号 串 s 的 每 一 个 符 
号 均 取 自 一 个 有 限 符号 集 S， 称 ”为 移 位 寄存 器 的 长 度 . 


pesa 
[SS 


图 24-1 
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在 寄存 器 开始 工作 时 , 这 只 级 的 初 态 从 左 到 右 为 
Sn-1; Baia, ***, 81. So, 

从 处 于 最 右边 的 第 1 级 寄存 器 读 出 的 内 容 即 作为 这 % 级 移 位 
寄存 器 的 输出 . 

同时 这 级 寄存 器 的 状态 经 过 图 24-1 中 上 方 的 一 个 矩形 所 
代表 的 开关 线路 进行 综合 ， 在 一 个 移 位 脉 串 的 作用 下 ， 每 一 级 寄 
看 器 中 的 内 容 传递 给 右边 的 一 级 寄存 器 ， 同 时 将 上 述 开 关 线 路 的 
输出 传递 给 第 % 级 寄存 器 , 即 图 24-1 所 示 最 左边 的 寄存 器 . 

在 第 一 个 移 位 脉冲 作用 下 , 7 级 移 位 寄存 器 的 状态 从 左 到 古 
变 为 

$5, Sa-i; ***, Se, 31, 

第 1 级 寄存 器 的 原先 状态 so 已 被 污 出 ， 作 为 输出 的 第 一 个 符号 . 

按照 上 述 方式 不 断 加 以 移 位 脉冲 , 就 可 以 输出 序列 s. 我 们 也 
说 这 个 序列 s 由 上 述 移 位 寄存 器 生 成 . 

在 图 34-1 中 的 开关 线路 所 实现 的 输入 输出 关系 即 本 节 一 开 
始 写 出 的 递归 关系 了 我 们 今后 也 称 了 为 开关 函数 , ERS’ 到 
8 的 喘 射 。 以 下 一 般 均 取 S=1{0, 1} 来 讨论 ， 如 果子 为 线性 函数 ， 
BI RISE 

S, 77 —038,.1 — 081-9 — *** Onn on, 
则 称 序列 s 为 线性 (反馈 ) 移 位 寄存 器 序列 . 当然 , 这 里 的 乘法 与 
加 法 都 在 与 S 相应 的 有 限 域 中 进行 ， 对 于 &= 1{0, 1}， 上 述 等 式 
AAW BR 6 为 0 或 1, 运算 按 模 2 进行 . 相应 地 可 以 用 图 21-3 
的 线性 (反馈 ) 移 位 寄存 器 来 生成 序列 s，。 TRES. FIER 
存 器 在 技术 上 是 非常 简单 的 . 但 是 应 当 看 到 , FAM n EE 
m 位 寄存 器 有 2^ 个 , 但 不 同 的 % 级 移 位 

寄存 器 则 有 .2 个 ,因此 提供 了 多 得 多 
的 可 能 性 . 

现在 叙述 以 移 位 寄存 器 为 计算 模 
型 的 序列 复杂 性 的 度量 方法 , 
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对 于 给 定 的 有 跟 序 列 
S= So $1 *** Sp—1s 

将 生成 s 的 长 度 最 短 的 线性 移 位 寄存 器 的 级 数 称 为 序列 s 的 线性 
复杂 性 (或 线性 复杂 度 ) ,相仿 地 在 允许 了 为 二 次 或 无 次 函数 时 , 可 
以 定义 8 的 二 次 复杂 性 或 + 次 复杂 性 ， 在 [117] 中 将 生成 s 的 级 
数 最 少 的 移 位 寄存 器 的 级 数 称 为 序列 * 的 极 大 复杂 性 (Maximal 
Order Complexity). 

以 下 主要 介绍 比较 成 熟 的 线性 复杂 性 .注意 这 时 在 多 数 文献 
中 所 称 的 序列 s 的 线性 复杂 性 是 指 生 成 周期 序列 s7 的 最 短线 性 
移 位 寄存 器 的 级 数 ， 


§ 24.2 几 个 简单 例子 
[Bl 1] 如 图 3234-3 所 示 是 一 个 四 级 线性 移 位 寄存 器 , 相应 的 
递归 关系 (或 开关 函数 ) 为 
SS Sa tat Satsa 9254, 
可 以 证 明 , 根据 不 同 的 初 态 ， 它 有 四 种 输出 ， 即 全 0 串 和 三 组 周期 
5 的 周期 序列 , 即 
(00110)*, (11110)", (01010)”, 
以 及 它们 的 所 有 移 位 序列 ， 


A Leads 


图 24-3 
[52] 图 244 icum T 存 器 , 递归 关系 为 
Si = Si-a F S14, oA, 
可 以 证 明 , 除了 生成 全 0 串 之 外 , 这 个 移 位 寡 存 器 的 输出 是 周 
期 5 的 周期 序列 ， 即 (000100110101111)” 及 其 所 有 移 位 序列 . 
在 图 24-2 所 示 的 % 级 线性 黎 位 寄存 器 的 一 般 框图 中 , 如 系数 
e, 0, 则 称 为 是 非 退 化 的 ， 上 面 的 两 个 例子 都 是 非 退 化 的 . 
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可 以 证 明 ， 非 退化 的 线性 移 位 寄存 器 在 任何 初始 状态 下 的 输 
出 总 是 周期 序列 ， 容 易 由 此 看 出 , LA Jm SB a C POL, 则 输出 总 
ERREARI. 这 对 于 一 般 的 移 位 寄存 器 也 成 立 , 可 参见 [115]. 
$24.39. 线性 复杂 性 的 计算 方法 
:以 下 对 S-(0, 站 介绍 线性 复杂 人 性 的 计算 方法 。 全 元 的 叙述 
SEKS RS) [114], 
对 于 满足 递归 关系 
Sı = —0615,-1— *** — 0181 él 
的 线性 移 位 寄存 器 序列 , 引入 联系 多 项 式 
fio) =1+ eu --- orem, 
称 ?为 寄存 器 的 级 数 , 并 采用 记号 Cf Dr, 
PRR Se ETRE N 的 一 个 有 限 序列 
S=80 Sy *** $5—4, 
计算 的 方法 荐 对 每 个 2 一 1，2，…, 不 ， 求 出 生成 PIDE so 8 7 
8-1 的 最 短线 性 移 位 寄存 器 . 记 相 应 的 联系 多 项 式 为 fu, 级 数 为 
i,.。 浴 用 递归 方法 , 从 多 一 开始 计算 到 光一 六 ， 
SLAY Bl BR FLEE SFP RG R A FIA Ba; 


1. WM no0 使 
$90—81—*::—8,,3—0, S, 77 1, 
WS do—di—- = dn; dn = Sros 
f= f= fl, Jap ikat, e. 
belo = bnn =, Lt = 707-1, 


2. HERH b>, à—1, Um no n N, 其 中 


2 SF age [E EFL ETE y USE, 


"um f. Lt easten” Fr oua, 
计算 d, — 8,470,184 3 d- *7* FO nt, Sn des 


Jasa R- Ju Lua = ba, 
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BIA sos sa FE Cf, Tao REER s. MEE, AO, eom AL 
tp «men, be—«44-hs 4 
fuac fete ™ fins tt= max{t,, n+1—-1,}, 
采用 以 上 公式 计算 , EA <fr, D» Nib, READY fo WERA 
线性 移 位 寄存 器 的 联系 多 项 式 , by 是 其 级 数 , 也 就 是 序列 s 的 线性 
Am. 
如 果 要 求生 成 周期 为 N 的 无 限 序列 (sos $85: 7 H Be E X 
性 移 位 寄存 器 , 则 可 以 证 明 , 只 要 用 同一 算法 于 序列 (sost…Sw- 功 ” 
OR A fase ?axw>， 就 可 以 得 到 所 要 的 结果 . 
CA 1) 计算 生成 长 度 为 15 的 序列 
000100110101111 
HAE MAE, 1,> 的 计算 称 为 第 % 步 计算 , 整 
个 过 程 如 下 : 
前 四 步 为 开始 部 分 ， 从 
So = 8, 88 =D, sa 一 十 
得 到 do = d, = da = 0, ds= 1, 
fi=fo=fa=1, fita, 
y= =k =O, t= 4. 
SAI, ds=titso—0, fs— fa, =h, 
第 六 步 ， ds=Ss5+81=0, fe fo. laste. 
SEP. dese $2— 1, 
这 有 时 %=6, m —8, 得 到 
^ofo—ferz?fa—l4a-ta*, 5-4. 
dE T WWE d. (nz) 38 223 0, HE Cf, tr) 就 是 生成 上 
述 序列 的 最 短 移 位 寄存 器 ， 实 际 上 这 即 是 图 24-4 中 的 结果 . 


$24.4 Spy BAP 


本 小 节 介 绍 由 特 布 里 湖 (N. G. deBruijn) 提 出 而 命名 的 特 布 
BMP, 它 有 广泛 的 应 用 (参见 [118]、[115]、[L116])。 
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特 布 里 浏 序列 是 由 0 和 工 组 成 的 周期 为 2 的 宕 空 的 周期 序 
列 ， 在 它 的 长 为 22-1 rf dep mau 2 A BUB v ino. 121 
f. 即 每 一 组 合 恰好 出 现 一 次 ，%=1.2. 3 时 的 特 布 里 渊 序列 的 一 - 
个 周期 为 : 
n-1, 01, 
2-2, 0011, 
52-8, 00111010 5; 01110001, 
FHUAR- AA T1 ES. CC EP EE RE REC HUNE 20, 3€ 
2" 个 长 为 nw 的 不 同 串 用 作 图 中 的 2? 个 结 点 ， 从 结 点 (zza…z,) 到 
结 点 (ya"…ys) 存 在 有 闻 弧 的 条 件 是 
Yr? Yn—1 = va Tn, 
这 时 就 用 一 条 标 以 符号 v. 的 有 向 弧 连 接 这 两 个 结 点 . 这 样 就 使 
每 个 结 点 有 两 条 弧 通 向 其 他 结 点 、 特 布 里 渊 序列 对 应 于 在 这 个 有 
向 图 中 的 一 条 封闭 回路 ， 它 从 任何 -个 结 点 出 发 访问 每 一 个 结 点 
恰好 一 次 后 加 到 起 点 , 
一 般 称 上 述 有 向 图 为 特 布 里 调 图 .在 本 书 的 某 些 部 分 已 使 用 
这 类 似 的 图 ( 见 图 15-1 和 图 19-1), 
可 以 证 明 , 上 述 不 同 闭路 的 个 数 为 3777 (Bw [118])， 在 
表 24.1 上 询 出 了 对 应 于 前 几 个 % 的 特 布 里 渊 序列 的 周期 个 数 以 
及 下 面 将 要 介绍 的 线性 复杂 性 e(s) 的 上 、 下 界 . 这 里 对 于 移 位 后 
相同 的 各 个 周期 序列 只 计 为 一 个 . 


* 24.1 


67108864 


38-63 


EW], [116]), Æ n23 时 ， 周 期 为 2" 的 特 布 里 
淡 序 弄 的 线性 复杂 性 cs) 满足 不 等 式 
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2^-1--n«ze(s) «2^ —1, 
同时 这 里 的 上 .下 界 均 可 达到 . 

E n=8 时 , Pi LEA 8 的 特 布 里 测序 列 的 e(9) 的 上 述 上 、 下 
界 恰 好 相等 ， 都 等 于 7.。 利用 在 8 24.2 中 的 算法 即 可 求 出 在 图 
24—5 中 所 示 的 最 短线 性 移 位 
寄存 器 ， 只 要 取 合 适 的 初 态 就 BP 
可 以 分 别 生 成 这 两 个 特 布 里 洲 -SS 
周期 序列 ， 相 应 的 联系 多 项 式 
是 图 24-5 

-Hote tote 25 7 - x - a, 

一 般 认为 , 特 布 里 渊 序列 具有 较 高 的 线性 复杂 性 , 可 以 作为 复 
要 序 烈 的 很 好 的 有 限 有 到 近 .， 近 来 也 有 关于 它 的 2 次 复杂 性 与 
(之 3) 次 复杂 性 的 研究 ， 但 从 上 述 特 布 里 湖 图 可 以 知道 ， 周 期 a 
的 特 布 里 渊 序 列 具 要 用 nn 级 非 线 性 移 位 寄存 器 就 可 以 生成 ,例如 ， 
生成 %=8 的 特 布 里 渊 序列 

00111010 
的 开关 函数 为 : 
111—0, 110-51, 101—520, 010-50, 
100— 0, 000-1, OO1-»1, O11-1, 
因此 按照 在 [117] 中 的 极 大 复杂 性 度量 ， 特 布 里 浏 序列 为 简单 序 
列 ,或 者 说 复杂 程度 不 高 的 序列 . 


824.5 5 K(x) 的 比较 


[B BE THRSIAR PCREIRAELAR BE BU EM, RTELUCATE A Jp 28 
的 复杂 性 也 是 一 种 描述 复杂 性 ， 只 是 在 那里 是 以 通用 图 灵机 为 计 
算 模型 , 而 在 本 节 则 用 移 位 寄存 器 为 计算 模型 . 
实际 上 , 设 一 个 有 限 序列 s( 这 里 即 指 周期 序列 s") 的 线性 复杂 
性 为 els), 那么 从 最 短线 性 移 位 寄存 器 的 ce(s) 个 系数 和 cts) 个 初 
始 状态 sost…so-u 就 给 出 了 s 的 一 个 描述 。 从 这 个 观点 出 发 , 在 
203 


[119] rp UE Als) = 20(s) EAR FAB s n n ze TE HE 
H, 并 与 柯 尔 英 哥 洛 夫 复 末 性 K (a) EIC SR. 

在 [i191] 中 证 明 : 

工 ， 对 任何 给 定 的 s O<e<cl, 

probísC 10, 1}"| (1-8) A(s) 
<K(s}<(1+s8)A(s)} — 0(n— oo}, 

2. Ms 为 无 限 序 列 , 是 s 的 长 为 到 的 前 缀 , 那么 在 勒 贝 格 

测度 的 意义 上 几乎 处 处 成 立 


n) 
lim LOD) 


Ais) 

由 这 两 个 结果 可 以 看 出 , A KAS te EVA, 这 两 种 复 
杂 性 度量 方法 似乎 是 一 致 的 .在 [1201 中 对 此 提出 了 不 辐 的 观点 ， 
认为 仅仅 从 以 上 两 点 不 能 得 出 上 述 结 论 ， 并 且 指 出 了 线性 复 当 性 
与 柯 尔 呐 森 洛 夫 复 江 性 很 不 相同 的 一 些 特 点 .这 些 问题 有 待 今后 
作 进 一 步 研究 . 


1, 


$25 ” 兰 帖 尔 一 齐 夫 复 来 性 


本 节 介 绍 兰 峭 尔 和 齐 夫 (A. Lempel, J. Ziv) 提 出 的 一 种 复 
杂 性 度量 ， 主 要 材料 来 源 为 他 们 的 论文 [121] 及 其 在 动力 系统 中 
的 应 用 . 


$25.1 一 种 容易 计算 的 复杂 性 


我 们 已 经 知道 ， 在 8 22 定义 的 柯 尔 莫 哥 洛 夫 复 杂 性 是 不 可 计 
算 的 . 实际 上 ， 在 上 节 介 绍 的 线性 复杂 性 在 很 多 情况 要 作 准 确 
计算 也 是 相当 困难 的 ， 例 如 , 在 824.4 中 的 特 布 里 渊 序列 的 线 
性 复杂 性 分 析 就 是 在 不 久之 前 才 得 到 完全 解决 的 (参见 [115]、 
[116]), 

兰 帆 包 和 和 章 夫 在 [131] 中 提出 一 种 相对 来 说 容易 计算 得 多 的 
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复杂 性 度 景 ， 在 [91] 的 最 后 - : 章 对 此 也 作 了 介绍 ， 并 称 之 为 兰 柏 
IR-F RAINE. db, 在 某 些 文献 中 世 将 [131] 中 的 复杂 性 称 之 
WHT RAT RM ARTE, 实际 上 两 者 有 很 大 不 同 , 请 读者 注意 . 

为 急 述 方便 起 殉 ， 本 节 在 叙述 时 如 不 作 说 明 ， 一 般 均 考虑 由 
8-10, 1) 所 生成 的 有 限 或 无 限 符 号 序列 ， 将 由 s 的 复杂 性 记 为 
e (s) XX, c, 

仍然 采取 在 $ 22 中 的 描述 复杂 性 的 观点 , 但 在 这 里 代替 图 灵 
机 而 采用 只 具有 两 种 简单 操作 的 计算 模型 来 描述 一 个 给 定 序 91, 
并 将 所 需 的 某 种 操作 次 数 作 为 序 烈 的 复 染 性 度 晤 . 

第 一 种 操作 是 复制 , 或 者 说 拷贝 ， 简 单 来 说 , 即 用 序列 的 某 个 
前 缀 中 的 子 串 生成 更 长 的 前 级 .第 二 种 操作 即 是 对 已 生成 的 部 弘 
添加 一 个 符号 ， 当 然 ， 任 何 一 个 长 度 为 n% 的 符号 序列 可 以 从 空 出 
开始 ; 用印 次 第 二 种 操作 生成 . 但 我 们 所 关心 的 是 与 $ 22 一 样 的 
最 短 描述 ， 在 [131] 中 提出 一 个 算法 , 它 直接 可 以 对 给 定 序列 作 复 
林 性 分 析 , Euh RU 

先 举 几 个 例子 , 然后 说 明 一 般 法 则 . 

[f] 1] 序列 为 全 0 上 囊 0000.… 

从 空 串 s 出 发 用 添加 操作 生成 第 一 个 符号 0。 在 这 以 后 只 需 
用 复制 方法 即 可 ， 将 这 个 过 程 记 为 

0000.… — 0-000», 
这 里 右 方 出 现 的 “.2” 代 玫 第 二 种 操作 的 使 用 ,按照 [1211, 重复 使 用 
复制 操作 侍 不 用 “-* 分 开 ， 最 后 , 将 由 记号 “2” 分 成 的 子 串 个 数 定 
义 为 该 符号 则 的 复杂 性 庶 基 . 对 于 上 述 例子 ， 只 要 0 RIKER 
F1, 复杂 性 6 都 是 2. 

[ 例 2] 1019010…. 

See 开始 添加 二 然后 再 添加 符号 0。 在 这 之 后 只 要 用 复制 
HARET. ARIE 

101010. — 10.10100", 
4g ARTE 6。=-3. 
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更 在 叙述 一 般 法 则 ， 设 序列 为 
Sss, 
从 8 m ACRES Es. MA RR aR, Be AE a IR SaS 
r«n 并 且 下 一 个 符号 s 是 用 添加 操作 完成 的 , 记 为 
8189: "Sn —® 81*892""°Sr Sra, 
这 里 在 s, Riding "RAT s HERE. 现在 给 出 如 何 做 下 
去 的 法 则 . 

EF l= MR ERTU Qoe 用 揽 册 方法 得 到 ， 其 中 
878,77$,, 和 5 表示 将 它 前 面 的 符 叶 串 的 最 后 一 个 符号 去 拖 后 的 绑 
果 , 在 这 里 即 是 有 ressos, 

如 果 @ 不 能 从 see 中 某 个 子 溃 拷 贡 得 到 ， 则 就 用 添加 操作 加 
上 so 并 如 上 一 个 记号 “…, 这 样 又 回 到 与 刚才 相同 的 情况 . 

WMR =s 可 以 从 Qa =s) 中 某 个 符号 复制 得 到 ， 则 继续 
观察 Q— scisco 能 否 从 sQm KT PRR ARE. coat 

SO —$;---5,8.,1, 
如 果 能 办 到 , UTES EQ s trot, 并 提出 同样 的 问题 ,这 样 下 
去 有 黄种 可 能 , 或 者 入 已 包含 了 原来 给 定 的 序列 的 最 后 一 个 符号 
sw 则 分 析 已 经 结束 ， 或 者 对 某 个 已 , 它 不 再 能 从 se 的 任何 一 个 
子 帅 复 制 得 到 ， 这 时 就 采取 添加 操作 ， 将 这 个 @ 的 最 后 一 个 符号 
添上 , HE am Lids”, 

因此 可 以 看 到 , SES iS” AR TORR RE BY 
次 数 ， 如 果 符 号 患 在 上 述 分 析 结 束 时 以 “结束 ， 则 这 个 记号 “” 
的 个 数 就 等 于 符号 串 的 复杂 性 .否则 , 将 个 数 加 一 妈 得 到 复杂 性 . 

(fA 3] 0010, 

按照 上 述 算法 共有 由 步 ， 

1. AZ ado i-o. 

2. 这 时 s=0, Q—0, sQ=00, sQa=-0, 因此 名 可 以 从 sQ 
复制 得 到 , 记 为 — 0-0, 

8. s=0, Q=01, sQ—001, sQw —00,— $$ 4A Q AAEM sQa B 
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制 得 到 .采用 添加 操作 得 到 一 0:01.. 

4. s=001, Q—0, sQ—0010, sQxz=001， 旬 可 从 001 35 D1 15 
到 . 计算 已 结束 ， 景 后 的 结果 是 

0010 — 0.01.0. 

复杂 性 c=3. 

[44 4] 0001101001000101, 

REALA 中 的 例子 .我 们 只 列 出 复杂 性 分 析 的 最 后 结果 为 

0.001.10.100.1000.101， 

它 的 复杂 性 为 6. 

以 上 分 析 方 法 容易 在 计算 机 上 编 成 程序 ， 在 [122] 中 有 相应 
的 方 框图 . 


$25.2 理论 基础 


如 果 将 符号 串 s 的 所 有 子 串 称 为 8 PRAWA, WHAIA 
v(s), 那么 上 述 分 析 过 程 可 以 看 成 是 不 断 寻 找 新 词 的 过 程 。 具体 
来 说 , 如 果 某 个 中 间 过 程 为 =>sQ 一 ,那么 当 Qu Ra) it, 就 称 
如 可 以 从 s 出 发 用 复制 操作 生成 .否则 就 用 添加 操作 .这 意味 着 
在 吾 中 一 定 出 现 了 在 Rs 中 不 具有 的 某 些 新 词 ， 它 (或 它们 ) 一 定 
E R DES 

理论 上 已 经 证 明 , 只 要 按照 上 一 小 节 介绍 的 算法 , 就 可 以 得 关 
于 一 个 符号 串 的 最 短 描 述 , 即 添 加 操作 次 数 尽 可 能 少 的 描述 . 

REA SRS 有 a 个 符号 ,序列 sES"* WKE |slaon 在 
[121j] 中 证 明 , cfs) 的 上 界 为 

e(s) « CLER : 
其 由 
1-- log log (om) 
log n : 
ECREREDANE-THE, HR 6099). Bind 
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般 说 e (8) LL n/log H ER, Hop n Ls! 对 数 log 以 o IRR, 
BRICK S RT I] BUE, 当 nw 充分 大 时 , ERKA n8 
BUR o^ 个 不 同 符号 串 中 , BK BEL RTER ERE T XX EH 

n/ log. 
如 果 假 定 这 o^ 个 符号 串 都 以 相同 的 概率 出 现 ， 则 在 [121] 中 
WEH, 对 每 个 sE (0, 1), RE 
lim prob { os) < 


与 $23.1 485, 如 果 将 "充分 大 时 成 下 


a(1-—2) 
log n 


Is| =n} =o, 


作为 随机 捉 的 定义 , 那么 可 以 看 出 , 在 % 充 分 大 时 , 长 度 为 n 的 符 
BR AREXE, 或 者 说 是 复杂 的 . 反之 则 说 在 符号 
Bs 中 有 模式 或 结构 存在 . 

我 们 现在 将 这 个 复杂 性 定义 用 于 分 析 在 $ 24,4 中 介绍 过 的 
Fh EWF. Xj 5= {0, 1},a=2, 

LB 5] dts 是 周期 为 2? 的 特 布 里 渊 序列 中 长 度 为 22 一 
的 一 个 有 限 子 种 ， 这 时 ， 如 & 24.4 所 述 , Te s 中 的 尾 何 两 个 长 汐 
的 子囊 都 是 彼此 不 相同 的 , 因此 在 用 本 节 的 复杂 性 分 析 时 , 从 前 
一 个 记号 “.” 到 下 一 个 记号 “.” 之 阅 的 长 度 不 可 能 超过 h.。， 于 荐 对 
|s| =a RA 

2*-- k—1 


se "dm ED dus 
成 立 ， 因 此 按照 这 里 关于 复杂 性 ( 即 随机 性 ) 的 定义 ， 特 布 里 渊 序 
列 具 有 较 高 的 复杂 性 . 


825.8. 关于 非 等 概率 情况 的 修正 


在 上 述 理论 分 析 时 的 一 个 重要 前 提 是 ， 在 S 中 的 各 个 不 同 符 
号 在 符号 串 中 是 以 等 概率 方式 出 更 的 ， 对 于 给 定 的 一 个 充分 长 的 
符号 串 或 从 某 个 信 源 发 出 的 符号 量 ， 可 以 统计 各 个 符号 出 现 的 实 
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FUSE LLL ER 


所 频率 ， 如 果 发 现 明显 不 符合 上 述 等 概率 前 提 时 , TE [121] 中 提供 
了 下 列 修 正 . 

限于 讨论 a=2 的 情况 , RHS-, 1}, 35H p fül—p4r8MX 
BGS O 和 工 的 出 现 概 率 ，、 这 时 信息 论 中 给 出 了 信 源 痛 

h~ —plogp— (1—p)log(1—p) (ext) 

的 计算 公式 ， 在 p=0.5 Mh AARRE L 

在 [121] 中 证 明 ， 只 要 将 上 一 小 节 中 的 %/log% 用 hm/1log%w* 代 
F, 有 关 结 论 仍然 成 立 . 

具体 来 说 , 先 用 统计 方法 求 出 各 个 不 同 符号 出 现 的 机 率 (的 近 
WIE). HARA A RII, Da. MRA H 
显 小 于 1, 则 将 复杂 性 分 析 所 得 的 度量 (8) 5j An/log n 作 比 较 . 如 
两 者 很 接近 ， 我 们 认为 符号 串 是 复杂 性 较 高 的 串 ， 或 者 说 是 随机 
R. WSR o(s) 明显 低 于 An/log n, WUA ER s 中 存在 某 种 模式 . 


$25.4 在 动力 系统 中 的 应 用 


在 [123] 中 将 兰 帕 尔 - 齐 夫 复杂 性 用 于 单 峰 映射 与 一 维 元 上 胞 自 
动机 ， 得 到 了 很 有 意义 的 结果 ， 这 里 主要 介绍 在 单 轿 映射 中 的 应 
用 情况 ， 

5j $ 28.8 类 似 ， 先 将 轨道 转化 成 符号 序列 ， 然 后 计算 它 ( 们 1 
的 复杂 性 , 不 同 的 轨 可 以 有 不 局 的 复杂 性 . 

设 有 踪迹 I(O)-A(f'()-—s5xe50 (308 5.22, HE RU 
长 为 w 的 前 级 记 为 | 


8° = 8182" t Say 


并 且 记 
cn—0Cs™). 
然后 , 同时 计算 o. 和 归 一 化 的 复杂 性 度量 
I,--2-, 


b, 
Jp 5 -n/logn, 当然 ,在 这 之 前 应 进行 统计 处 理 , 以 判断 是 否 要 
209 


Fl 8 25.8 中 的 修正 ， 

MF HK AR F(a) =Beftz) 3<a<4 在 [123]1 中 计算 
To m b, i 得 到 如 图 站 -所 示 的 结果 , 其 中 包含 以 下 内 容 : 

1° 对 于 有 稳定 周期 轨 的 
情况 , 当 m 充 分 大 时 , o ETE 
ERË. 

2° 在 费 根 饮 姆 点 ?5 
二 3.57 处 ， 当 “n>co 时 c, 趋 
FRX, E In-0,/6, WH 
T 0, 

3” 在 混沌 情况 , 24 no» co 时 六 一 cy ATARE. 

不 难 对 于 这 些 实验 结果 作出 理论 上 的 解释 . 首先 要 注意 ， 虽 
然 不 同 轨 可 具有 不 同 的 复杂 人 性， 但 对 于 二 次 方 映射 的 上 述 儿 种 情 
UL, RATE MEAS WBRZ, 从 其 余 的 初始 点 出 发 的 轨 
具有 类 似 的 符号 动力 学 行为 ， 上 述 计 算 机 实验 是 对 这 类 典型 轨 玉 
进行 的 ， 

对 于 有 稳定 周期 轨 的 情况 ， 丰 妨 直接 讨论 周期 踪迹 8 与 
8 25.1 pi 1,2 完全 一 样 , 只 要 n sl, 就 有 ce, 一 ce(s)， 对 于 一 般 
的 典型 轨 也 是 类 似 的 . 因此 当 % 充 分 大 时 6 收敛 于 某 个 有 限 值 ， 

对 于 费 根 饮 姆 点 的 结果 也 是 容易 理解 的 .为 简单 起 见 下 面具 
分 析 揉 序列 本 身 , 对 其 他 典型 软 的 分 析 可 利用 8 10.4 rng s ROC 
做 .这 时 我 们 知道 ， 有 限时 间 内 落 到 不 稳定 周期 轨 上 的 情况 是 非 
Jt zy, 而 与 吸引 子 距离 趋 于 O 的 轨 是 典型 的 . 

如 8 加 .2 那样 , 记 各 为 这 时 的 揉 序列 .对 于 它 的 长 为 呈 的 前 
级 , 存在 b, 使 | | 

2971-7 nx a" 


成 立 , 直接 利用 在 8 10 rp ati 58, 从 

i = lim fp, i aio Ents (nz20) 
. 就 得 到 Cn 一 五 十 荆 
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logic/b) 


这 样 就 已 得 到 


lim c, = co, 


另 一 方面 ,对 于 上 述 归 一 化 复杂 性 可 以 建立 
Les we ger 
因此 得 到 
lim I, -= 0. 


从 这 里 看 到 , 采用 e. FIL, 两 个 度量 来 刻 划 费 根 鲍 姆 吸引 子 是 
有 好 处 的 . 前 者 反映 了 它 比 有 稳定 周期 轨 情 况 更 复杂 的 一 个 侧面 ， 
后 者 则 有 反映 出 它 的 动力 学 行为 也 有 简单 的 另 一 个 侧面 , 实际 上 , 这 
与 $13.3 的 分 析 是 一 致 的 

对 于 粗 粒 混沌 情况 (参见 [36]), 利用 在 8 9.5 中 的 结果 ， 可 以 
证 明 当 ”一 co 时 I, 趋 于 有 限 正 值 . 这 里 最 简单 的 情况 即 是 二 次 
方 映射 中 的 满 射 情况 , 映射 f(z) 二 4m(1 一 x) 存在 绝对 连续 遍历 不 
EWE, 它 的 支 集 即 是 区 间 [0, 1), RBPTR PR, Ate ME 
迹 是 随机 性 达到 极 大 的 符号 序列 , 于 图 35-1 中 表现 为 Him 1。=1, 


对 于 一 般 的 狙 粒 混沌 也 可 以 作出 类 似 分 析 . 

在 [122] 中 还 将 这 种 复杂 性 分 析 方 法 研究 一 维 元 胞 自动 机 , 得 
到 了 很 有 意义 的 结果 ， 这 时 由 于 兰 巾 尔 - 齐 夫 复 杂 性 的 计算 量 很 
小 , 可 以 计算 多 次 迭代 后 的 构 形 所 具有 的 复杂 性 , 这 是 一 个 很 大 的 
fü si. 

关于 这 种 复杂 人 性 度量 在 动力 系统 研究 中 的 进一步 应 用 与 分 
析 , 还 有 待 今后 的 探索 . 
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附录 A 


本 书 》6 中 两 个 定理 的 证 明 


在 这 个 附录 中 给 出 在 86.1 的 定理 1 和 56.5 的 定理 3 的 数 
学 证 明 . 


À.l 定理 1 的 证 明 


为 读者 方便 起 见 , 将 定理 工 叙述 如 下 ， 
定理 工 设 了 为 单 峰 映射 ,KS f RPA, Rid 
L-.g(KXS), 
那么 对 任何 #E L, 存在 点 RE [0, f(0)1, Bt £ EE Eze I (o) HRT. 
证 明 分 KS 不 会 符号 6 和 含 符号 e 的 两 种 情况 来 讨论 .在 
证 明 中 经 常 要 将 有 限 序列 与 男 一 个 有 限 或 无 限 序 列 比 较 ， 分 出 序 
的 大 小 .这 里 的 定义 与 $5.3 48]. 但 在 等 号 成 立时 ， 划 应 理解 
为 较 短 序列 为 较 长 序列 (包括 无 限 序 列 ) 的 前 缀 . 
用 反 证 法 。 设 存在 一 个 序列 经 ED， 使 得 对 任何 点 “E LO, 
Fe), 三 都 不 是 路 迹 To) 的 前 级 . 
先 讨论 揉 序列 KS 不 含 符 导 6 的 情况 . 
定义 集合 
Li={z€ [0, f (0)]1I(%) < 
和 R= {s€ [0, fie)]|I(@) >t}. 
我 们 将 证 明 和 Re 都 是 区 闻 [0,， fle)] 中 的 非 空 开 集 . 由 反 证 法 
假设 ; RAL, flo] 一 DU R, HF. UPR L. X R 
的 讨论 是 类 似 的 ， 
由 反 证 法 假设 , TA t 不 会 是 全 0 M, AOL, 同样 可 知 
FER, Aiwa AE SR, 
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Bihl, Whaiti WEE. 由 证言 工 的 定义 ， 在 
ELPRESS 0, 
fER ge L, Wily) sss, 我 们 要 证 明 存在 一 个 邻 域 
Og) c 即 证 明 yy Di 的 内 点 ,这样 就 可 征明 OL, WARSI. 
My€h, Ily) «t. 因 此 存在 1 Lem, $Ë eresi tr 
t-i S05. RANE t TÆ ORE IS 以 下 讨论 Ll 的 情况 . 对 
于 到 =0 的 讨论 是 类 似 的 ， 下面 将 分 别 几 秘 铺 况 来 构造 49 的 邻 域 
O(y). 
Kiel, 可 见 ss ER R s; H OR 0, 80 s; — 0, 则 利用 
映射 了 连续 , 可 以 定义 
O(y) = («€ [0, f(e)]| I(2) 以 ss ABR}. 
这 时 的 OWARE, HW E OQ C. Ds. 
WFL=1 和 81=6 WR, WT LUEH Ln (而 不 能 有 了 一 分 ， 
否则 , 考虑 开 区 间 
(z€ [0, f(0]|I(2)VÀ sive Sa H BUR, 
在 这 个 区 间 上 fRA Asso 可 见 f 取 到 临界 点 6， 从 而 
也 会 取 到 在 临界 点 两 鲁 的 值 . 因此, mA tan, 则 已 找到 一 个 点 ms 
使 (zy -与 与 反 证 法 假设 矛盾 
Ki<n hk, TO Bt AR, 它 从 oo 开始 ， 同时 ， 由 于 
从 st 开始 的 符号 电 一 定 是 揉 序列 本 身 , 因此 成 立 
hrr eS attt Ss. 
如 果 成 立 严格 不 等 号 , 则 存在 % BUR Dro mm 
biti Fra-i = Spit * Sitat xa Spa. | 
这 时 定义 
O(y) -ie€ (0, FOI I SIMS 1, 
S $—1, 14-1, S Dno 位 相同 }. 
它 是 一 个 开 集 .对 于 wzEO(o), 如 果 工 四 的 第 了 D 0 8 o, We 
RLI WME IRE EL WA Loon p HR np LU 
成 立 IQ) RARE T OMe, 
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FEA Luci SaaS, 的 情况 这 时 定义 
Oly) = {w€ L0, f (21 |1@) I) 
的 长 为 n 的 前 级 除了 第 1 位 外 相同 }. | 

HF sees 中 除了 so 外 不 出 现 符号 co，O(2) 仍 为 开 集 ， 对 于 2 
€O(y), 从 反 证 法 假设 , Ze) SB 1 位 不 会 是 长 否则 Ce) BA 
ARR). WHER Ts)<# 成 立 , 从 而 有 OG D, wa4=-1 的 讨 
论 已 完毕 ， WA-O 的 讨论 从 咯 ，- 

现在 讨论 揉 序列 KS ATIS e 的 情况 ， 这 时 的 临界 点 6 为 局 
期 点 .下面 我 们 只 指出 与 上 面 不 同 的 凡 个 地 方 , 而 不 详细 写 出 全 
部 过 程 . 

仍 设 yE Ln I(y)-55:-s,-, WEE 

8,718171 = bilia, S, e b, 

4129 8 1-1, s, o Mi<n BST DL. 

如 果 sas. 是 KS 的 前 绥 ， 但 其 中 不 出 现 符 号 o， 则 讨论 与 
以 前 相同 , 

如 果 seres 中 出 现 符号 o， 包 括 出 现 多 个 符号 c 的 情况 ， 则 
可 以 先 定 义 

O(y) - 1€ [0, f(e)]|E(o) 与 T(y) 在 长 为 nw 的 前 缀 中 

除 符 号 ?所 占 的 位 置 外 完全 相同 }. 

然后 利用 临界 点 e 的 有 限 次 原 象 具有 有 限 多 个 的 事实 , 缩小 OC) 
为 

Oly) = 15€ O(g) | 4 ae E ICE) 

的 长 为 ”的 前 绷 中 不 含 路 

Oy) y RFR. 

#RuEOly), sry, ABIGO) UE, € 

Ty) —S1'8/i21681447 8193-10 81 paa *7* 

TE Sisi Sai 中 不 出 现 只 需要 讨论 tae tinea = Suat Sai 
AR. 这 时 可 写 


£778, 8 ada Sipe-ibizat’*, 
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现在 证 Tle) Sy Se TS p40 Spate", 
HE hem Sosa WA tae tee JAR Ro — 0, 则 已 
有 I(z)<t 成 立 ， 如 果 a-l=t, WEE te, M Oly) 的 定义 ， 
可 见 Sia DFE OMIT, Marthe Wi tevtie tt, te By 
I(z)«t, MR cote, Wü ICE) E Ri Ha [se — FE, H. 
AGA, EA IA saa 开始 重复 Shasta, REA 
Sia Strath HEB, 我 们 可 以 用 同样 的 方法 讨论 下 去 .按照 反 
HAR, Ie) 不 可 能 以 tEAM. 这 时 就 会 与 上 面 一 样 推出 
I(e)«t, 于 是 已 建立 Cg 三 了 

LU FOU Ly 为 非 空 开 集 ， 对 于 已， BUSES 定理 + 证 
明 完 毕 ， 

注 ， 以 上 擅 用 的 方法 与 [23] 中 证 明 $5.4 的 充分 条 件 部 分 的 
方法 是 相同 的 .但 实际 上 这 里 是 用 反 证 法 来 进行 的 ， 在 证 明了 

{eE [0, f(e)] I(2) UA t AWA} HS 

之 后 , RPUTOBEIJPE AW L-5 R WERK, 


A.2 定理 3 的 证 明 
Em TE KS 不 是 周期 序列 则 有 
=L=£(KS), 
这 里 语言 l 
L= {1E {0, 1}*] 存在 无 限 串 s, EL € ANR, 
且 对 每 个 i>0 H o'(s)< KS}, 
L= {tE {0, 1 FERME s, DIL € WHR, 
且 对 每 个 $203 o s)-K8) - 
(8559.15 86.5), 
ZH ”从 定义 已 有 LCL, REE LCL, | 
BT L Al L 5&4 EA KS 所 确定 , 而 与 以 8 为 揉 序列 
的 具体 映射 无 关 ， 因此 可 以 对 某 一 个 这 样 的 映射 来 证 明 工 = Li. 
利用 二 次 方 映 射 当 参数 从 0 到 么 时 为 完全 族 ， 即 能 取 到 任何 
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一 个 单 峰 映射 的 揉 序列 (参见 [23]), 因此 存在 bo ERA f(a) = 
or 人 IT 一 z) 以 定理 中 的 KS 为 其 揉 序列 . | 

MEEL, WHALER, HEA we LO, f(c)], 使 
踪迹 I(%) 以 t 为 前 织 ， 这 样 的 点 4 全 体 所 成 的 集 是 开 的 . 利用 临 
界 点 6 的 所 有 原 象 不 超过 可 列 个 , 我们 可 以 取出 一 个 点 z, 使 T(z) 
不仅 以 为 前 缀 ,而 且 不 含 符号 c。 我 们 还 不 妨 设 已 有 2< flo). 

共 几 要 条 件 (本 书 第 多 页 中 之 基本 结论 1) 可 知 , XH $21, 
成 立 o'(I(z))« KS (HF as f(o), 在 4 一 0 时 也 成 立 )， 

我 们 要 证 明 , 对 这 个 踪迹 I(w) 来 说 , 于 每 个 9220 时 成 立 

co'(I(s))< KS, 
在 5=-0 时 从 =s<7e) 可 见 已 不 成 问题 ， 然后, BUT i 是 I(w) 的 前 
级 , 就 得 到 所 要 的 结论 1€ Tn. 
用 反 证 法 , 如 对 某 个 5>0, 有 
e(Ito)) = KS(—ICf(c))). 
利用 | 
(Ila) = (fe) . 
可 见 .Fo 与 876) 的 踪迹 完全 相同 , 因此 区 间 e), fle)] 中 每 
个 点 的 踪迹 都 等 于 KS, 即 所 谓 同 宿 区 间 《Homterval)， 由 于 这 时 
的 KS 为 非 周期 , 而 二 次 方 映射 满足 施 瓦 兹 导数 为 负 的 条 件 , 因此 
从 [23] 中 的 有 关 定 理 知 道 , 映射 f(w) 一 bow(1 一 4) 不 存在 稳定 周期 
Ho 也 不 存在 非 退 化 的 同 窒 区 闻 , 于 是 只 能 成 立 
fia) = fle), 
但 由 于 这 时 已 有 多 > 0， 而 .Fe) 的 原 象 只 可 能 是 临界 点 o， 因此 
Jiz) 一 0。 这 与 踪迹 (a) PRES ¢ HF. TE. 

注 ， 如 果 揉 序列 是 含 符 号 上 的 周期 序列 ， 那 么 定理 8 的 结论 
是 平凡 的 ， 但 在 揉 序列 为 不 含 符号 的 周期 序列 时 ， 容 易 举例 说 
明 

Lol, 
是 可 能 的 . 
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附录 B 
之 (KS) 为 正规 语言 的 充分 条 件 


在 这 个 附录 中 证 明 在 § 8 中 的 定理 2 和 定理 3( 见 $8.4)， 即 
当 拉 序列 KS 为 周期 序列 和 终极 周期 序列 时 ，-2Z(K8) 为 正规 语 
H. 
此 外 ， 在 B.8 PRA RRAKSR, 在 B.5 中 介绍 循环 
移 位 最 大 字 的 概念 , 对 于 本 书 的 有 关 部 分 都 是 不 可 缺少 的 工具 . 


B.l 关于 周期 揉 序列 的 一 个 引 理 


在 87.5 介 绍 了 关于 zE .2(K8) 的 一 般 判 定 法 则 .对 于 周期 
揉 序列 , 可 以 有 更 为 方便 的 结果 . 
2|: i KS=c", o WR, KE |z| =n, 那么 2E (KS) 
的 充分 必要 条 件 是 ，g 的 每 一 个 长 度 不 超过 m TE 满足 条 件 
gT, 
证 明 ”由 于 ws<z H g«a7(— KS) SH, WS 
z€ L= (K8) 
时 , Ba?’ CL, 因此 必要 性 不 成 问题 .以 下 讨论 充分 性 . 
HRES. RARS ECS, zs 后， 但 % 的 每 一 个 长 度 不 超 
indc Ed <o 当然, 只 需 讨论 lel > 的 情况 . 
应 用 $7.5 AEE, Keel Oe AR o> KS=2%, 
根据 反 证 法 条 件 , 当然 有 Do] m 成 立 ， 现 在 观察 的 长 为 % 的 前 
 Mo>K8=2" 可见 它 不 能 小 于 z， 另 一 方面 ,从 条 件 已 知 它 
不 能 大 于 ww， 因 此 可 见 w» 以 s Dg BIS. 
AL > 为 偶 串 ， 可 继续 讨论 。 的 长 度 为 以 一 |e|) 倍数 的 前 
Bh, 得 到 分 解 式 
ya, 
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Hp 1-0, [s| «n, he WAR, 易 见 
v—KS eo o> KS 6 v>. 
(B. o! 也 是 zz 的 一 个 子 串 , 长 度 小 于 7 因 玫 与 引 理 条 件 相 了 矛盾 ， 证 
E 
注 ， 如 KS8=zw” 中 2 为 奇 囊 ， 则 应 当 用 a7 (UR o 后 再 应 用 上 
述 引 理 . 


B.2 定理 2 的 证 明 


将 $ 8. 和 4 中 的 定理 2 重复 如 下 . 

定理 2 KS AAS, MACKS) HEME. 

证 明 ”应 用 在 86.3 中 的 讨论 , 不 妨 假定 揉 序列 中 不 含 符号 
c 记 为 KS 一 wg*， 同 时 设 o BABE. 

主要 关键 是 证 明 有 等 价 关 系 CR’ 成 立 ， 然 后 应 用 $8.7 中 
的 定理 4, 就 可 以 得 到 所 要 的 结论 。 这 里 kr EHRE L= ra) 
在 S* 中 引入 的 自然 等 价 关系 (参见 $1.8 与 $58.8 9). 

ERES M wm%EL 坊 wzEL 是 显然 成 立 的 ， 因 为 zz 作为 
oc 的 子 电 当然 属于 工 (参见 $7.4 性 质 1). Koc bDoace La 
讨论 如 下 ， 如 果 meEL， 则 应 用 B.i 的 引 理 ， 可 见 串 ee PE fI 
个 长 度 不 超过 [s] (—70 LT HR ws， 但 这 立即 推出 wz 也 具有 
此 性 质 ， 再 次 应 用 引 理 , 就 得 出 *?zG 工 ， 这 样 就 证 明了 所 要 求 的 
等 价 关系 .证 毕 . 

注 ， 在 [351]、[86] 中 , 通过 构造 接受 工 = Po”) HARA WH 
来 证 明定 理 2( 参 看 本 书 $8.5 与 38.6 等 ). 


B.3 关于 既 药 事 的 基本 概念 和 事实 


在 定理 3 的 证 明之 前 需要 介绍 有 关 既 约 符号 串 的 知识 ， 实 际 
E, 在 符号 序列 的 研究 中 这 是 必 不 可 少 的 . 
定义 ”对 于 非 空 符号 串 多 如 有 果 它 不 能 写成 y= 如 ， 其 中 以 为 
某 个 符号 串 , 指数 1>1， 则 称 y 为 既 约 (符号 ) 串 ; BM, Wy 为 非 
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RAGS) Ving—ul, u WEAR, ku Sy y HIR Pri- 
mitive Root) (£ hi (4]). 

这 方面 的 最 基本 事实 有 

引 理 ”一 个 非 空 串 4 为 非 工 约 串 的 充分 必要 条 忻 是 存在 两 个 
EER y Al ye, 使 

Y = Vaya — Yo, 

证 明 ”必要 性 是 明显 的 , Mya, 01, Wha d s Au dn 
Fe RITT. 

反之 , WRT LIB ASE A yi A yo, dH y= yiya = Yous, M 
GRE yy 和 9s WEE. 如果 1s] — ys], 则 也 有 em. As 
u=, =y) BA y-—uw 成立， 对 于 两 者 长 度 不 等 的 情况 ， 不 护 
Wikis. M says — yy WB HIER ya 以 ya ABR. i rA 
-Vrys mal A lys}< ly WA 

919a = T Vstfa = ota — YF "ys => Yaya = ovs, 

继续 做 下 去 ， 局 如 求 两 个 自然 数 的 最 大 公 因 于 时 的 轰 转 相 除 法 那 
FE, T 0119 34 u, 使 y 一 ww 171, 证 毕 . 

注 ， 这 时 a fH y. iE u Bd. 这 是 一 个 有 用 的 事实 . 


B.4 定理 3 的 证 明 


将 88.4 中 的 定理 3 重复 如 下 . 
定理 3 du KS— pA", W -ZK8) 为 正规 语言 . 
证 明 不 妨 设 在 pX” PNAS ALARA SE. 对 于 和 
A AREE BAN UL 令 
k=[l{el/|4,]+2, 
我 们 将 要 证 明 KS 的 两 个 前 绷 为 REY: 
pA Ri pA. 
对 于 和 为 奇 既 约 串 的 情况 , 对 同样 的 e, 可 以 证 明 
‘OM Ry part? 
然后 , 只 要 应 用 8 8.7 中 的 定理 4 就 可 以 得 到 所 要 求 的 结果 , 由 于 
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上 述 两 种 情况 的 讨论 大 同 小 异 ， 我 们 在 下 面 只 给 出 % 为 偶 既 约 串 
时 的 证 明 . 
4£X 2€ S*, 我 们 来 证 明 
pA"s€ L= pA*Hzc T, 

如 果 # AW 的 前 缀 , 则 显然 成 立 ， 否 则 , 可 以 分 解 <=x'%", 其 
中 多 的 任何 真 前 级 是 和 ” ERR, 但 w 本 身 则 不 是 . 由 此 可 见 ,将 2 
i a 2 “ 则 是 A 的 前 缀 ， 因此 可 写 出 

g — ez, = Ahh, 
Jtr A20, 是 入 的 一 个 前 级 . Sar 
PAE L> pz GL, 
记 
pa'z! = parte P 
然后 应 用 $7.6, 记 它 关于 KS 的 最 长 前 后 缀 为 尺 .因为 ptz" KY 
不 是 KS WAR, 所 以 | 
lu | < [oz |, 

如 果 [ul > leal, RERO u Ji KS ATR, BG w= pra", 
1>0, A" 为 入 的 真 前 撤 ， 但 同时 v SE pate’ — pn)! 的 后 级 ， 
HH >A HRA A B.S 的 引 理 ， 只 能 导致 = 名， 但 NW' 为 入 的 
RUA, 而 多 则 不 是 , SAB. 

BLUE jw| 忆 [pAl， 从 的 选择 可 看 出 ,如 既是 pae 的 后 组 , w 
也 是 Aho” 的 后 纵 ， 由 此 又 推出 % 也 是 Ate’ 的 最 长 前 后 纹 , 应 用 
88.7 定理 4 的 证 明 中 的 第 一 个 结果 , 可 见 成 立 

pa! Ry pM tg, 
因为 它们 关于 KS 的 最 长 前 后 级 相同 . 

再 利用 等 价 关 系 Ro 的 右 不 变性 质 (C 9,8 1.8, AJ rove, 

MISH 


因此 已 建立 了 


pitz Ry pA" tz. 


PAEL => PAREL, 
相反 关系 的 建立 过 程 完全 类 似 , AB. 这 样 就 证 明了 所 看 的 结论 ， 
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ik. 在 [87] 中 的 证 明 方法 与 此 不 同 ( 参 看 本 书 88.5.38.6 和 
8 9), 


B.5 GRE RRKF 


现在 引进 循环 移 位 最 大 字 的 概念 ， 且 利 用 娩 约 性 导出 一 个 有 
用 的 事实 ， 

设 zs 一 za an ERRA n AARP, ER 

G(a) == Hes" uda 
为 4 的 一 次 循环 移 位 ， 一 般 地 有 
OD) = En I&i 
和 o(s) =a, 

这 里 对 于 循环 移 位 的 记号 与 85.9 中 的 移 位 算 子 c 的 记号 相 
T3], 它 在 具体 场合 的 含义 可 以 由 上 下 文 来 区 分 开 . 

定义 于 (ze) 是 在 fot(z)j<ice 中 按 序 为 最 大 的 一 个 ， 并 称 
Moc) 为 串 z 的 循环 移 位 最 大 字 ( 串 ). MK, TE ow), O(a), vy 
ea"(z)(=2) 中 可 能 有 一 个 以 1 :的 圳 等 于 MO), 

MRA c= Mc), WE w 为 循环 移 位 最 大 字 ( 串 )， 

对 于 KS=0", 因为 KS 为 移 位 最 大 字 ， 所 以 必 有 w= M(xw). 
反之 , WEA = Mo), Wo 为 移 位 最 大 字 ， 即 可 以 是 某 个 单 峰 
ph $t i EE PU, 

利用 B.1i3p5 2i uj le. 如 果 2 PRA, 则 foe) haces 中 任 
何 两 个 都 不 相同 ， 因 此 只 有 了 唯一 的 一 全 5E {L s, n), WE oa) 
~ M (a) MM. 


附录 C 


-关于 $10.4 的 补充 


在 本 附录 中 给 出 在 $10.4 中 的 命题 的 证 明 ， 然 后 介绍 它 的 推 
广 及 其 应 用 . 


C.1 命题 的 证 明 


重新 叙述 在 $ 10.4 中 的 命题 如 下 . 
命题 如 果 s 是 费 根 鲍 姆 吸引 子 的 多 许字，KS9 一 如一 lim t 


同时 s 以 某 个 恕 (8209) 为 前 缀 ， 即 有 Ss=tfzo 那么 "的 长 度 为 
2(=|t|) 的 前 组 只 有 两 种 可 能 。 1° o DL WH, 2 o DLE, 
LEER 
证 明 对 用 数学 归纳 法 .在 £=0 时 如 = 因此 是 平凡 的 ， 
现 设 上 述 论断 对 五 以 及 比 天 小 的 站 然 数 已 成 立 , 讨论 1 时 的 情 
况 . 
将 多 许字 s 写成 
S= yit = ful t m d iba ift, 
对 其 后 级 如 -to 用 归纳 假设 (s 为 多 许字 时 如 -za 也 是 允许 字 )， 可 
v 的 长 为 社工 的 前 级 不 是 ba, RE h BA 
(2 aa = beoy 
可 见 % 不 能 以 tua ARIA. THOR vii. 
这 时 s= toil’, 对 trv’ AAA, BT Do” DI ta 9X 
fr 为 其 前 级 ， 又 从 
hab > braite bh 
可 见 AR ba WAR. eh”, WE 
$-- A EN ue == batur. 
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再 对 to" FE ELAHE UE, 这 时 o" 的 长 为 中 的 前 绷 不 是 灰 就 是 ty. XT 
WAS = talk = bynten MA, S= TER A = typt" 已 证 明 


GO.2 m P 


土 述 命 题 可 以 推广 成 相当 一 般 的 引 理 ， 它 不 仅 可 蕉 出 上 述 命 
题 ， 而 且 包 含 了 在 文献 中 的 一 些 其 他 结果 为 其 特例 ， 这 里 的 问题 
是 , 一 个 符号 串 的 某 个 前 级 , 在 什么 条 性 下 对 符号 串 的 其 余部 分 起 
某 种 制约 作用 . 

引 理 设 上 和 s 是 只 由 符号 0 和 1 mm, 或 均 为 有 限 串 ， 
或 沟 为 无 限 串 ， 如果 有 

f= uV, S=Uw, SSA WKY 
f] iJ ec Dy Sy HH, ABA v= wE tms), 
证 明 不 妨 讨论 无 限 串 情况 ， 记 
P= ta On, W = Wa 0 

用 数学 好 纳 法 证 明 对 每 个 nl pin On ws. 

TE n—1i kf, A 全 一 二 则 从 t Mune fh, nr sm 一 工 m 
v, —O, WM so o dB wi —0 

PRE 工 生 和 安 MAR u= w, 讨论 os M Wna. WR 

eU, ERB, vua d, WM SS 二 和 uve, BAB, WA uas 
-1, fi va =0, UM eoo BH su 70, 

在 v.v, 是 奇 串 时 , 如 oaa mL 则 从 vies MI wa], 如 
9,447 0, WK tuvo, ARH, s<t, 就 得 到 we=0， 证 毕 . 

C.3 从 奇 事 平方 开始 的 移 位 最 大 字 

在 符号 动力 学 讨论 中 一 个 很 有 用 的 结果 可 以 从 上 述 引 理 推 
iB. 

推论 如 二 为 移 位 最 大 字 ， 且 以 多 为 前 缀 ，9 HH, 那么 


Ty. 
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证 明 dc 
00 
其 中 全] = |y|， 由 于 为 称 位 最 大 字 , i 
s«t, GY (f) 一 gi ger, 
Büw«y. 应 用 O.28g9|Bh Tey FEN =y —m 
地 , ROR Pe y" ws, 222, MAL SS RIF — FEES] v — y, 从 而 二 
以 VU RR. WE. 


C.4 其 他 例子 


[B] 1] JH O.2 中 的 引 理 可 以 对 0.I1 给 出 一 个 新 的 证 明 . 
写 出 
fo = trte, 8=fry, 

并 写 4 一 vw", Bop v 前 长 度 为 [5| -1-2'-1, AMA s<t 和 
<p RM. 由 于 条 与 名 只 在 最 后 一 个 符号 上 不 同 ， 因 此 可 以 应 
用 下 理 ， 知 道 v' dit, (RAWAM. FERR oO 从 0 还 是 1 开 
始 , 就 可 以 推出 以 如 或 名 为 前 级 ， 这 就 是 Q.1 中 命题 的 结论 . 

[82] mM KS—y", y JA B, S 是 以 2 为 前 级 的 多 许字 ， 那 
A s=", 

实际 上 , 5 s—yu, WA 

s«yy^(-K8), | v—o" (sy, 

应 用 引 理 , 即 得 到 u— g^, 
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附录 D 


联系 太白 与 已 中 的 公式 


在 这 里 我 们 证 明 在 $ 18.5 中 的 基本 公式 


1 1 
F0 731-5 + RID 


Xp N (ee L- V (K9) By RR, 其 定义 为 
N (t) -14- > N, (25 


Dt) FE AREA KS—a2-2,WAEBIIETI TEX, 在 KS 不 含 符 
号 “时 ,已 的 定义 为 

D(t) —1-- Bib + est 十 二 Bi 十 (3) 
RH emela), 函数 8 的 定义 为 

s(0)—1,  s(1)—-1, 
在 K9 会 ce 时 ,可 以 按 86.2 中 的 方法 处 理 ， 或 按 [21] 中 的 方法 写 
出 D(O, 两 者 完全 一 致 . 
利用 在 $13.8 中 引入 的 序列 (S, bos, 可 以 定义 函数 


(1) 


8(0-3-- DS, (4) 
SI WEBER SC 5 DOOBEA SR, 
1 
S(t) TH DG 《5) 
然后 只 要 用 S =N — Nu BR S BAS), 
公式 (6) 等 价 于 对 n> 2 的 恒等式 组 
S,- ~ema m eil am i m ea e (L— 6n), 
(6) 


UFR KS 从 符号 1 开始 , 即 4 一 1， 这 时 总 成 立 S11 eet, 
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KS 加 从 符号 0 开始 , 网 只 能 是 07). 

现在 直接 王 明 : x] EE fü] 22, 恒等式 (6) 成 立 . 

按照 定义 ,入 ,是 语言 PKS) 中 长 为 吕 昌 从 符号 工 开始 的 字 
的 个 数 ， 我 们 可 以 将 (6) 的 右 方 的 每 一 项 与 一 种 计数 操作 等同 起 
来 , 并 且 证 明 这 些 计数 操 必 的 总 和 恰恰 是 Sa. 

右 方 第 一 项 的 计数 意义 蚌 清 楚 的 .因为 m=1、 6=s(m) 
一 一 二 所 以 ， 可 以 将 —a S a 看 成 是 对 于 语言 SZ OKS) HEE n 
AM 工 开 始 前 字 的 计数 (参见 8 13.3 的 例 1), 

但 从 第 二 项 开始 , 事情 没有 这 样 简单 ,我 们 不 妨 设想 每 一 项 的 
计数 操作 都 记录 在 一 个 帐 本 上 .， 在 系数 一 at…ai>0 时， 将 (的 中 
右 方 对 应 的 项 —6:-68.- 看 成 向 账本 中 加 入 数量 为 Sa 的 符 导 
囊 ， 长 度 均 为 mn， 形状 均 为 mia…wy， 其 中 yc ZKS), MEH 
从 符号 工 开始 ， 这 时 yy 的 长 度 为 % 一 i 从 aas 一 一 可 知 K9 
HAR ao, BAR. 当然 ， 这 里 并 未 保证 这 些 串 一 定 在 语言 
¥ (KS), 

在 OO, RB 一 8 一 一 二 我们 将 46) 右 方 相应 的 项 解 
FEA Mik Anh I ARBAB Sni tE. 

我 们 从 (6) 右 方 第 一 项 起 逐 项 进行 上 述 计 数 操作 这 里 允许 
Bris AE SEE, 即 是 要 删 去 的 串 说 未 入 帐 时 先 要 删除 也 是 允许 的 ， 
可 以 先 记 下 来 ， 然 后 在 今后 能 “归还 ”时 算 清 这样 做 下 去 直到 莽 
后 一 项 ， 当 &…sn= 一 工时 规定 将 拒 序 列 的 前 缀 aco. 计 入 帐 本 ， 
EM MT Rm- L are) /2 为 工 的 情况 , Ede nos, = 1 时 则 
不 进行 任何 计数 ， 

对 于 一 个 长 度 为 wn BuTPS Bu 它 有 可 能 记 入 帐 本 或 从 帐 本 
中 蔓 去 ， 并 且 有 可 能 多 次 进 现 这 凑 种 情况 我 们 可 以 将 记 入 帐 本 
的 动作 对 应 于 +1, 而 将 从 帐 本 中 删 去 的 动作 对 应 于 一 

我 们 将 要 证 明 , d z€ (KS), 且 基 从 符号 1 开始 的 长 为 n 的 
串 ， 则 在 计数 活动 全 过 程 中 按 上 述 土 1 MEH MR RAY 
+1, BRI,N eg £Z(ES) 且 为 从 i 开始 的 长 为 nw 的 帅 , 则 这 个 代 


226 


数 和 必 是 0, 其 中 包括 从 不 会 加 计数 活动 的 串 在 内 容易 理解 ， 只 
MARAE 网 公式 《6) 就 成 立 。 RA, AAS) 8 OD) 也 都 
成 立 . 

现在 开始 证 明 以 上 上 论断. 

XI 6) PAR ESC.Z(KSD, RA 1 开始 且 
Kye. 按 上 述 规 定 不 会 参与 今后 的 任何 计数 操作 ， 因 此 代 
RAPA +1, 这 是 最 为 简单 的 情况 ， 

现 设 揉 序列 的 前 继 为 

MaA, = 10"10"1-+-10", 


SEs m>0, 6-1, h, Sith, Bee RREN a BAR 


BLAH. AA TILE RAE. 
1. z€ L=. F (KS), 但 不 以 10" HAT, 
这 时 % 将 以 
11, 101, --., 10-11 
中 的 某 一 个 为 其 前 级 .， 因 #EL, KEH Sa. S. x WEAR m 
步 操作 中 必 和 将 这 样 的 2 记 入 帐 本 , 而 且 不 会 再 删 去 . 反之 ， 又 可 看 
th, 在 这 ?ou 步 中 入 帐 的 每 一 个 串 都 属于 工 (应 用 $7.0), ERE 
各 项 系数 均 为 +1, 
2. zE L, 以 10" 3X; üi £3, H r*a an, 
RH up i e 的 形式 为 
2—10"1-10"y, — 1«i«5—1, 
其 中 多 不 以 10" AR. Te y 以 
0, 11, 101, +, 10" 
中 的 某 一 个 为 其 前 级 . 
HF ee L, y<10", AAT FER. 这 时 10"1---10" yE L, 
六 此 在 与 10” 对 疙 的 计数 操作 时 已 将 z 入 帐 了 ， 但 当 Y 不 是 从 昌 
开始 时 ， 在 与 10710" 对 应 的 计数 操作 中 又 会 将 4 PRAHA, 
由 于 ? eB, RAREST, 直到 最 后 一 次 在 与 i 
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10"109 对 应 的 计数 操作 中 将 s 计 入 帐 内 , 六 不 再 变化 .这 里 ?是 
B y-10n. pp OP 的 长 度 、 y 从 0 开始 时 ， 计 数 操作 少 两 
次 , 仍 为 奇数 , 代数 和 为 +1, | 

3. z& L, 如 s— 107y, pn, y 从 符号 1 开始 , WAS 7.5 mp XL 

10fyc&L «€» y&L, 

Fk FAS AEH MS Et RRSS SER, 

RB z= 107---10"y, y ALL 10" HMB, Hye L, ET 
è, l«é«l, {E 1091-10" y C T, WRS HRD RHR. 应 用 
$7.5, 可 看 出 

10"*1--:10*97 a, ++, 
又 从 移 位 最 大 字 的 性 质 有 
Oy? Gn > 10™1:--10"710"m 

和 y= 二 10"*， 可 推出 101.10" BAB. Wie St 的 奇偶 性 相 
FJ. Way i<- R. 

讨论 6 为 偶数 的 情况 ,从 1071-10" 25 FB, 在 这 时 将 串 从 
帐 本 中 删 去 ( 即 欠 帐 操作 ). 在 这 之 后 入 帐 与 删 去 操作 交替 进行 , 直 
IJRA- KME. SP 为 奇数 的 情况 是 类 似 的 . 

HTE i 不 存在 时 的 讨论 , 与 上 面 的 第 2 种 情况 相仿 ， 

总 之 ， 在 这 里 的 入 帐 与 删除 前 代数 和 为 零 , pote eL n 
FEED, 

Á. 2 = (69 a, = 10"1---107». 

Ink AR, Weens RABE 10"1.--10"- 所 对 应 
的 入 帐 操作 中 己 进 入 帐 本 , 并 不 会 再 变动 ， 如 e 为 奇数 , WERE 
后 一 次 操作 是 删 去 ， 按 照 (6) 的 最 后 一 项 

(1—e::+-8,)/2=1, 

按 规定 将 它 加 入 ， 证 毕 . 

E: MAA ARSOHRSACEBS NOMA, ug 1/s. 
因此 , 从 数列 Saj BHU RRA A Lo. (K8) 的 增长 数 
s EN hk, 
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Lio] 
[11] 
[12] 
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